Я хотел бы использовать распознавание именованных сущностей (NER), чтобы найти подходящие теги для текстов в базе данных. Вместо использования таких инструментов, как NLTK или Lingpipe, я хочу создать свой собственный инструмент.
Мои вопросы:
Какой алгоритм мне следует использовать?
Насколько сложно создать этот инструмент?