Как лучше всего использовать слова в качестве функций в любом алгоритме машинного обучения?
Проблема: я должен извлечь объект, связанный со словом, из определенного абзаца. Следует ли использовать индекс в словаре в качестве числового признака? Если да, то как мне это нормализовать?
В целом, как сами слова используются в качестве функций в НЛП?