10
ответов

Алгоритм для нахождения статей с подобным текстом

У меня есть много статей в базе данных (с заголовком, текстом), я ищу алгоритм для нахождения X самых подобных статей, чего-то как "Связанные Вопросы Переполнения стека", когда Вы задаете вопрос. Я...
вопрос задан: 3 September 2018 16:35
10
ответов

Вычисление подобия двоичных данных

Я видел несколько вопросов, здесь связанных с определением подобия файлов, но они все связаны с конкретным доменом (изображения, звуки, текст, и т.д.). Методы, предлагаемые как решения, требуют...
вопрос задан: 24 February 2009 00:21
7
ответов

Расстояние Левенштейна: как лучше обработать слова, подкачивающие положения?

Я имел некоторый успех, сравнивающий строки с помощью PHP levenshtein функция. Однако для двух строк, которые содержат подстроки, которые подкачали положения, алгоритм считает тех как целых новыми...
вопрос задан: 19 November 2010 09:41
7
ответов

Сравните 5 000 строк с PHP Levenshtein

Я имею 5000, иногда больше, строки конкретного адреса в массиве. Я хотел бы сравнить их всех с levenshtein для нахождения подобных соответствий. Как я могу сделать это без цикличного выполнения через все 5000 и сравнения...
вопрос задан: 5 September 2010 15:43
7
ответов

быстрое обнаружение подобия

У меня есть большое количество объектов, и я должен выяснить общие черты между ними. Быть точным: учитывая два объекта я могу вычислить их несходство как число, метрику - более высокие значения...
вопрос задан: 15 December 2009 23:13
7
ответов

Подобие между пользователями на основе голосов

позволяет говорят, что у меня есть ряд пользователей, ряд песен и ряда голосов по каждой песне: Пользовательский =========== =========== ======= user1 song1 Голосования Песни =========== =========== ======= [...
вопрос задан: 2 December 2009 22:34
7
ответов

Алгоритм сравнения Word

Я делаю инструмент CSV Import для проекта, я продолжаю работать. Клиент должен быть в состоянии ввести данные в Excel, экспортировать их как CSV и загрузить их на базу данных. Например, у меня есть этот CSV...
вопрос задан: 23 January 2009 16:22
6
ответов

Как я определяю самую долгую подобную часть нескольких строк?

Согласно заголовку, я пытаюсь найти способ программно определить самую долгую часть подобия между несколькими строками. Пример: file:///home/gms8994/Music/t.A.T.u./ file:///home/gms8994/...
вопрос задан: 21 April 2016 18:43
6
ответов

стратегии нахождения дублирующихся почтовых адресов

Я пытаюсь придумать метод нахождения дублирующихся адресов, на основе счета подобия. Рассмотрите эти дублирующиеся адреса: addr_1 = ССЫЛКА ФЭРМОНТА '# 3 на юг' addr_2 = '3 ССЫЛКИ ФЭРМОНТА S'...
вопрос задан: 6 July 2013 00:46
6
ответов

Способы вычислить подобие

Я делаю общественный веб-сайт, который требует, чтобы я вычислил подобие между любыми двумя пользователями. Каждый пользователь описан со следующими атрибутами: возраст, тип кожи (масляный, сухой), тип волос (долго...
вопрос задан: 27 September 2011 01:59
5
ответов

Вычислительная степень подобия среди группы наборов

Предположим, что существует 4 набора: s1 = {1,2,3,4}; s2 = {2,3,4}; s3 = {2,3,4,5}; s4 = {1,3,4,5}; там какая-либо стандартная метрика должна представить степень подобия этой группы из 4 наборов? Спасибо за предложение...
вопрос задан: 10 January 2010 00:13
4
ответа

Лучший алгоритм ранжирования сходства для строк переменной длины

Я ищу алгоритм сходства строк, который дает лучшие результаты для строк переменной длины, чем те, которые обычно предлагаются (расстояние Левенштейна, soundex и т. Д.). Например, учитывая ...
вопрос задан: 18 September 2014 00:10
4
ответа

Сравнение строк с допуском

Я ищу способ сравнить строку с массивом строк. Выполнение точного поиска довольно легко, конечно, но я хочу, чтобы моя программа терпела орфографические ошибки, недостающие части строки и...
вопрос задан: 19 June 2013 11:42
4
ответа

То, как определить и проанализировать подобные шаблоны как Excel, делает?

Вы знаете функциональность в Excel, когда Вы, строки типа 3 с определенным шаблоном и перетаскивают столбец полностью вниз Excel, пытаетесь продолжить шаблон для Вас. Например, Тип... Протестируйте 1 тест 2...
вопрос задан: 7 September 2009 13:13
4
ответа

Подобие косинуса по сравнению с [закрытым] Расстоянием Хемминга

Для вычислений подобия между двумя документами я создаю характеристический вектор, содержащий частотности термина. Но тогда, для следующего шага, я не могу решить между "Подобием косинуса" и "Hamming...
вопрос задан: 3 June 2009 16:29
3
ответа

Сравнение изображения с php + gd

Что лучший подход к сравнению двух изображений с php и Библиотекой Графической ничьей (GD)? Это - сценарий: у Меня есть изображение, и я хочу найти, какое изображение данного набора является самым подобным...
вопрос задан: 31 May 2019 03:09
3
ответа

Python cosine_simility не работает для матрицы с NaN

Нужно найти функцию python, которая работает следующим образом: R func: proxy :: simil (method = "cosine", by_rows = FALSE), т.е. находит матрицу сходства путем попарного вычисления косинусного расстояния между кадрами данных ...
вопрос задан: 17 January 2019 20:18
3
ответа

Текстовый алгоритм подобия

У меня есть два файла подзаголовков. Мне нужна функция, которая говорит, представляют ли они иногда тот же текст или подобный текст существуют комментарии как "Ветер, дует..., музыка играет" в...
вопрос задан: 6 November 2011 15:15
3
ответа

Подсказки для проявления общих черт в файлах

В проекте я нашел некоторые файлы CSS, которые "пахнут" как, там вставляются копией правила в них. Интересно, что является Вашими стратегиями обнаружения материала вставки копии в файлах. Только любопытства я хотел бы...
вопрос задан: 31 July 2011 20:40
3
ответа

Обнаружение равенства изображения в различных разрешениях

Я пытаюсь создать сценарий, чтобы пройти мой оригинал, фотографии с высоким разрешением и заменить старые, низкие-res, которые я загрузил на Flickr, прежде чем у меня был профессиональный счет. Для многих из них я могу просто использовать информацию о Exi
вопрос задан: 17 February 2011 16:17
3
ответа

Что бумага “Oliver [1993]” описывает алгоритм PHP для вычисления текстового подобия?

Существует функция similar_text () в библиотеке PHP. Документация (http://php.net/manual/en/function.similar-text.php) говорит мне, что "Это вычисляет подобие между двумя строками как...
вопрос задан: 21 June 2010 12:40
3
ответа

группировка строк подобием

У меня есть массив строк, не многие (возможно, несколько сотен), но часто долго (несколько сотен символов). Они представляют в виде строки, обычно, ерунда и другая от другого.. но в группе тех...
вопрос задан: 28 January 2010 23:41
3
ответа

Ускорение levenshtein / similar_text в PHP

Я в настоящее время использую similar_text для сравнения строки со списком ~50 000, который работает, хотя должный к количеству сравнений, это очень медленно. Требуется приблизительно 11 минут для сравнения ~500 уникальных...
вопрос задан: 1 August 2009 02:56
3
ответа

Визуальный алгоритм поиска подобия

Я пытаюсь создать утилиту как этот http://labs.ideeinc.com/multicolr, но я не знаю, какой алгоритм они используют, кто-либо знает?
вопрос задан: 12 June 2009 19:56
2
ответа

Подобие косинуса Векторов различных длин?

Я пытаюсь использовать TF-IDF для сортировки документов в категории. Я вычислил tf_idf для некоторых документов, но теперь когда я пытаюсь вычислить Подобие Косинуса между двумя из этих документов, я добираюсь...
вопрос задан: 23 May 2017 11:54
2
ответа

Найдите подобие косинуса между двумя массивами

Я задаюсь вопросом, существует ли созданный в функции в R, который может найти подобие косинуса (или расстояние косинуса) между двумя массивами? В настоящее время я реализовал свою собственную функцию, но я не могу не думать...
вопрос задан: 30 March 2017 21:00
2
ответа

Как найти подобные результаты и вид подобием?

Как я запрашиваю для записей, заказанных подобием? Например, поиск "Переполнения Запаса" возвратил бы Переполнение стека Математическое Переполнение Переполнения SharePoint Благоразумное Водосливное Переполнение VFX, Например, поиск "...
вопрос задан: 5 May 2011 23:46
2
ответа

Найдите подобный символ ASCII в Unicode

Делает кто-то знает простой способ найти символы в Unicode, которые подобны символам ASCII. Примером является "КИРИЛЛИЧЕСКАЯ СТРОЧНАЯ БУКВА DZE (ѕ)". Я хотел бы сделать поиск и замену для подобного...
вопрос задан: 4 August 2010 09:29
2
ответа

'Подобие' в анализе данных

В области Анализа данных, там определенный раздел науки под названием 'Подобие'? Если да, с чем это имеет дело. Любые примеры, ссылки, ссылки будут полезны. Кроме того, будучи в новинку для поля, меня...
вопрос задан: 22 May 2010 09:16
1
ответ

Сравнение двух одинаковых картинок для получения значения сходства

Я пытаюсь создать собственное приложение, и мне нужно сравнить две картинки. Немного прояснения. Изображение будет содержать символ, написанный на листе бумаги. У меня будет "Оригинальная" картинка куска ...
вопрос задан: 17 March 2019 20:20