Как представить текстовые документы как векторы функций для классификации текста?

У меня около 10 000 текстовых документов.

Как представить их как векторы признаков, чтобы я мог использовать их для классификации текста?

Есть ли какой-нибудь инструмент, который автоматически выполняет представление вектора признаков?

11
задан Dan D. 14 February 2012 в 12:15
поделиться