Косинусное сходство и tf-idf

Меня смущает следующий комментарий о TF-IDF и Косинусное сходство .

Я читал на обоих, а затем в вики в разделе «Косинусное сходство» я нашел это предложение «В случае поиска информации косинусное сходство двух документов будет варьироваться от 0 до 1, поскольку термин частоты (веса tf-idf) не может быть отрицательным. Угол между двумя частотными векторами термина не может быть больше 90 ».

Теперь мне интересно ... разве это не две разные вещи?

Находится ли tf-idf уже внутри косинусного подобия? Если да, то тогда какого черта - я могу видеть только внутренние скалярные произведения и евклидовы длины.

Я думал, что tf-idf - это то, что вы могли бы до использовать косинусное сходство в текстах. Я что-то пропустил?

31
задан smci 24 April 2018 в 02:15
поделиться