Я пытаюсь создать свой собственный простой алгоритм выбора функций. Набор данных, с которым я собираюсь работать, находится здесь (очень известный набор данных). Может ли кто-нибудь дать мне указание, как это сделать?
Я планирую написать алгоритм ранжирования признаков для классификации текста. Это сделано для анализа настроений в обзорах фильмов, классифицируя их как положительные или отрицательные.
Итак, мой вопрос заключается в том, как написать простой выбор функций для набора текстовых данных.