Я должен использовать LingPipe или NLTK для извлечения имен и мест?

Вы не можете понравиться всем. Если я вхожу десять как 10 000, и кто-то входит десять тысяч как 10 000, Вы не можете обработать это без некоторого ведома культуры входа. Обнаружьте культуру так или иначе (браузер, параметр настройки системы - каков вариант использования? ASP? Внутреннее приложение, или открытый для мира?), или обеспечивают пример ожидаемого форматирования и используют самый снисходительный синтаксический анализатор, Вы можете. Вероятно, что-то как:

double d = Double.Parse("5,000.00", NumberStyles.Any, CultureInfo.InvariantCulture);
6
задан Stefanus 24 July 2016 в 08:40
поделиться

1 ответ

То, что вы описываете, - это распознавание именованных объектов . Так что я бы рекомендовал проверить другие вопросы по этой теме, если вы их еще не видели. Этот кажется мне наиболее полезным ответом.

Я не могу сказать, что лучше всего подходит для этой задачи - NLTK или LingPipe, хотя, глядя на ответы, кажется, что существует довольно много других ресурсы, написанные на Java.

Одним из преимуществ использования NLTK является то, что Python очень доступен как язык. Другое преимущество состоит в том, что книга NLTK (которая доступна бесплатно) предлагает введение как в Python, так и в NLTK одновременно, что было бы полезно для вас.

4
ответ дан 17 December 2019 в 07:06
поделиться
Другие вопросы по тегам:

Похожие вопросы: