Кластеризация разреженного набора бинарных векторов

Если у меня есть разреженный набор данных, где каждые данные описываются вектором из 1000 элементов, каждый элемент этого вектора может быть либо 0, либо 1 (много 0 и немного 1), знаете ли вы какую-нибудь функцию расстояния, которая могла бы помочь мне кластеризовать их? Является ли что-то вроде евклидова расстояния удобным в этом случае? Я хотел бы знать, есть ли простая удобная метрика расстояния для такой ситуации, чтобы попробовать на моих данных.

Thanks

6
задан shn 20 December 2011 в 08:40
поделиться