Я пытаюсь извлечь именованные объекты из своего текста, используя NLTK. Я считаю, что NLTK NER не очень точен для моей цели, и я также хочу добавить еще несколько собственных тегов. Я пытался найти способ тренировать свой собственный NER, но, похоже, мне не удалось найти подходящие ресурсы. У меня есть пара вопросов по NLTK-
- Могу ли я использовать свои собственные данные для обучения распознавателя именованных сущностей в NLTK?
- Если я могу тренироваться, используя свои собственные данные, нужно ли изменить файл с именем _entity.py?
- Должен ли формат входного файла быть в IOB, например. Эрик NNP B -ЧЕЛОВЕК ?
- Существуют ли какие-либо ресурсы -, кроме поваренной книги nltk и nlp с python, которые я могу использовать?
Я был бы очень признателен за помощь в этом отношении
задан user1502248 4 July 2012 в 18:24
поделиться