Библиотека Java, которая находит границы предложения

Вы можете установить расширение IntelliSense для PHP https://code.visualstudio.com/docs/languages/php .

7
задан hippietrail 24 February 2013 в 12:20
поделиться

2 ответа

Вы записали:

Я думаю, что это была бы умная реализация StringTokenizer, которая знает обо всех разделителях предложения, что языки могут использовать.

Основная проблема здесь состоит в том, что разделители предложения зависят от контекста, рассматривают:

Как сделал доктора Jones, вычисляют 5! без рекурсии?

Это должно быть распознано как единственное предложение, но если Вы просто разделите на возможных разделителях предложения, то Вы получите три предложения.

Таким образом, это - более сложная проблема, чем можно было бы думать в начале. К этому можно приблизиться с помощью методов машинного обучения. Вы могли, например, изучить проект OpenNLP, в особенности класс SentenceDetectorME.

3
ответ дан 7 December 2019 в 07:51
поделиться

Вы хотите изучить интернационализировавшие классы BreakIterator. Хорошая начальная точка для границ предложения.

4
ответ дан 7 December 2019 в 07:51
поделиться
Другие вопросы по тегам:

Похожие вопросы: