Я ищу способ с учетом фраз глагола английского текста в нем в прошедшие, настоящие и будущие времена. Сейчас я использую NLTK , делаю пометки POS (Part-Of-Speech), а затем считаю «VBD», чтобы пройти прошедшие времена. Это не достаточно точно, поэтому, я думаю, мне нужно пойти дальше и использовать чанкинг, а затем проанализировать фрагменты VP на предмет определенных временных паттернов. Есть ли что-нибудь существующее, что делает это? Любое дальнейшее чтение, которое может быть полезным? Книга NLTK сосредоточена в основном на NP-чанках, и я могу найти довольно мало информации о VP-чанках.
Точный ответ зависит от того, какой фрагмент вы собираетесь использовать, но понимание списка займет у вас много времени. Это дает вам количество глагольных фраз, используя несуществующий чанкер.
len([phrase for phrase in nltk.Chunker(sentence) if phrase[1] == 'VP'])
Вы можете использовать более детальный подход для определения количества времен.
Это можно сделать с помощью парсера Berkeley или синтаксического анализатора Stanford . Но я не знаю, доступен ли для них интерфейс Python.