Предположим, что существует 4 набора:
s1 = {1,2,3,4};
s2 = {2,3,4};
s3 = {2,3,4,5};
s4 = {1,3,4,5};
Там какая-либо стандартная метрика должна представить степень подобия этой группы из 4 наборов?
Спасибо за предложение метода Jaccard. Однако это кажется попарным. Как я могу вычислить степень подобия целой группы наборов?
Можно вычислить евклидовое расстояние между ними и построить из него дендрограмму для визуализации сходства.
Ваш вопрос не очень специфичен. Но, полагаю, вы имеете в виду что-то вроде «расстояния редактирования» между ними? То есть сколько нужно изменить s1, чтобы добраться до s2?
Посмотрите статью в Википедии на Изменить расстояние .
-121--4716653-можно вычислить размер пересечения между каждым набором
-121--4716655-Попарно можно вычислить расстояние Jaccard из двух наборов. Это просто расстояние между двумя наборами, если они были векторами булевы в пространстве, где {1, 2, 3...} все единичные векторы.
Как сказал TOBU, я бы использовал индекс jaccard который является лишь пересечением, деленным на союз наборов.
Вы можете вычислить размер пересечения между каждым набором
Еще хуже то, что ваша компания использует новое/незрелое программное обеспечение, которое вы сами разработали . Поначалу, когда я был единственным разработчиком, моя неповторимая структура HTML GUI работала просто прекрасно для построения нашего РИА. Однако, как только мы получили дополнительных разработчиков, я увидел, насколько ниже производительность разработчиков, если не использовать проверенную платформу с сильным сообществом. В связи с этим и тем, что я в конечном итоге понял, насколько неподходящий HTML 4 для RIA, мы перевели его в Adobe Flex 3. Я очень доволен ходом.
-121--1002536-Solr пока не поддерживает обновление отдельных полей , но существует проблема JIRA об этом (почти 3 года с момента написания).
Пока это не реализовано, необходимо обновить весь документ.
UPDATE : начиная с Solr 4 + это реализовано, вот документация .
-121--239055-Ваш вопрос не очень специфичен. Но, полагаю, вы имеете в виду что-то вроде «расстояния редактирования» между ними? То есть сколько нужно изменить s1, чтобы добраться до s2?
Посмотрите статью в Википедии на Изменить расстояние .