Я работаю над проблемой классификации текста, я пытаюсь классифицировать набор слов по категориям, да, для классификации доступно множество библиотек, поэтому, пожалуйста, не отвечайте, если вы предлагаете их использовать.
Позвольте мне объяснить, что я хочу реализовать. (возьмем для примера)
Список слов:
Список категорий.
здесь мы обучим набор следующим образом:
Теперь у нас есть фраза " Лучшая книга по программированию на java " из данной фразы следующие слова соответствуют нашему" Списку слов ":
" программирование "имеет два сопоставлены категории "java" и "c-sharp", так что это обычное слово.
«java» отображается только в категорию «java».
Итак, наша подходящая категория для фразы - "java".
Вот что пришло мне в голову, хорошее ли это решение, может ли оно быть реализовано, каковы ваши предложения, все, что я упускаю, недостатки и т. Д. ..