Алгоритм сравнения схожести идей (в виде строк)

Рассмотрим произвольное текстовое поле, в котором записан ответ на вопрос, что вы хотите сделать перед смертью?

Используя набор строк ответов (максимальная длина 240), я хотел бы каким-то образом их отсортировать, сгруппировать и подсчитать по идеям (что может быть просто сходством строк, как описано в этом вопросе).

  1. Есть ли другой или лучший способ сделать что-то подобное?
  2. Отличается ли этоот сходства строк?
  3. Это правильный вопрос?

Идея здесь состоит в том, чтобы люди писали в текстовом поле снова и снова, а я предоставлял число, которое описывает, вообще говоря, что 802 человека написали примерно одно и то же

5
задан Community 23 May 2017 в 12:17
поделиться