Распознавание именованных объектов с помощью Java

Я хотел бы использовать распознавание именованных сущностей (NER), чтобы найти подходящие теги для текстов в базе данных. Вместо использования таких инструментов, как NLTK или Lingpipe, я хочу создать свой собственный инструмент.

Мои вопросы:

  • Какой алгоритм мне следует использовать?

  • Насколько сложно создать этот инструмент?

5
задан Ken Bloom 6 April 2011 в 20:08
поделиться