У меня в основном тот же вопрос, что и у этого парня .. Пример в книге NLTK для наивного байесовского классификатора учитывает только то, встречается ли слово в документе как характеристику.. он не рассматривает частоту слов как характеристику для просмотра («сумка -из -слов» ).
Один из ответов , по-видимому, предполагает, что это невозможно сделать с помощью встроенных классификаторов NLTK. Так ли это? Как я могу выполнить классификацию NB по частоте/пакету -из -слов с помощью NLTK?