Матрица сходства -> алгоритм векторов признаков?

Если у нас есть набор из M слов, и мы знаем схожесть значение каждой пары слов заранее (иметь матрицу сходства M x M), какой алгоритм мы можем использовать для создания одного k-мерного битового вектора для каждого слова, чтобы каждую пару слов можно было сравнивать, просто сравнивая их векторы (например, получение абсолютной разности векторов)?

Я не знаю, как называется эта конкретная проблема. Если бы я знал, было бы намного проще найти среди множества алгоритмов с похожими описаниями, которые занимаются чем-то другим.


Дополнительное наблюдение:

Я думаю, что этот алгоритм будет иметь для создания одного, в данном случае желаемого, побочного эффекта.Если из матрицы слово A похоже на слово B, а B похоже на C, но обнаружено низкое сходство [A, C], вычисленная разница векторов результатов также должна давать высокое сходство [A, C]. Итак, мы бы восполнили предыдущие пробелы в матрице - как-то сгладили сходство с этим алгоритмом. Но помимо этого сглаживания цель состоит в том, чтобы получить результаты, максимально приближенные к исходным числам, которые мы имели в матрице.

6
задан Michael J. Barber 12 October 2011 в 09:52
поделиться