Вычислительная степень подобия среди группы наборов

Предположим, что существует 4 набора:

s1 = {1,2,3,4};
s2 = {2,3,4};
s3 = {2,3,4,5};
s4 = {1,3,4,5};

Там какая-либо стандартная метрика должна представить степень подобия этой группы из 4 наборов?

Спасибо за предложение метода Jaccard. Однако это кажется попарным. Как я могу вычислить степень подобия целой группы наборов?

5
задан Soup 10 January 2010 в 00:13
поделиться

5 ответов

Можно вычислить евклидовое расстояние между ними и построить из него дендрограмму для визуализации сходства.

0
ответ дан 13 December 2019 в 05:36
поделиться

Ваш вопрос не очень специфичен. Но, полагаю, вы имеете в виду что-то вроде «расстояния редактирования» между ними? То есть сколько нужно изменить s1, чтобы добраться до s2?

Посмотрите статью в Википедии на Изменить расстояние .

-121--4716653-

можно вычислить размер пересечения между каждым набором

-121--4716655-

Попарно можно вычислить расстояние Jaccard из двух наборов. Это просто расстояние между двумя наборами, если они были векторами булевы в пространстве, где {1, 2, 3...} все единичные векторы.

8
ответ дан 13 December 2019 в 05:36
поделиться

Как сказал TOBU, я бы использовал индекс jaccard который является лишь пересечением, деленным на союз наборов.

2
ответ дан 13 December 2019 в 05:36
поделиться

Вы можете вычислить размер пересечения между каждым набором

0
ответ дан 13 December 2019 в 05:36
поделиться

Еще хуже то, что ваша компания использует новое/незрелое программное обеспечение, которое вы сами разработали . Поначалу, когда я был единственным разработчиком, моя неповторимая структура HTML GUI работала просто прекрасно для построения нашего РИА. Однако, как только мы получили дополнительных разработчиков, я увидел, насколько ниже производительность разработчиков, если не использовать проверенную платформу с сильным сообществом. В связи с этим и тем, что я в конечном итоге понял, насколько неподходящий HTML 4 для RIA, мы перевели его в Adobe Flex 3. Я очень доволен ходом.

-121--1002536-

Solr пока не поддерживает обновление отдельных полей , но существует проблема JIRA об этом (почти 3 года с момента написания).

Пока это не реализовано, необходимо обновить весь документ.

UPDATE : начиная с Solr 4 + это реализовано, вот документация .

-121--239055-

Ваш вопрос не очень специфичен. Но, полагаю, вы имеете в виду что-то вроде «расстояния редактирования» между ними? То есть сколько нужно изменить s1, чтобы добраться до s2?

Посмотрите статью в Википедии на Изменить расстояние .

2
ответ дан 13 December 2019 в 05:36
поделиться
Другие вопросы по тегам:

Похожие вопросы: