Использование моего собственного корпуса для классификации категорий в Python NLTK

Question

Использование моего собственного корпуса для классификации категорий в Python NLTK

Я новичок в NTLK / Python, и мне удалось загрузить свой собственный корпус с помощью CategoryizedPlaintextCorpusReader, но как мне на самом деле обучить и использовать данные для классификации текста?

>>> from nltk.corpus.reader import CategorizedPlaintextCorpusReader
>>> reader = CategorizedPlaintextCorpusReader('/ebs/category', r'.*\.txt', cat_pattern=r'(.*)\.txt')
>>> len(reader.categories())
234

7

python nlp machine-learning nltk corpus

задан Fred Foo 11 January 2012 в 11:34

0 ответов

Другие вопросы по тегам:

python nlp machine-learning nltk corpus

Использование моего собственного корпуса для классификации категорий в Python NLTK

0 ответов

Похожие вопросы: