0
ответов

как найти сходство между двумя кривыми и показатель сходства?

У меня есть два набора данных (t,y1) и (t,y2). Эти наборы данных визуально выглядят одинаково, но имеют некоторую временную задержку или сдвиг величины. я хочу найти сходство между двумя кривыми (с оценкой ...
вопрос задан: 1 May 2012 09:07
0
ответов

Сравнение алгоритмов подобия

Я хочу использовать функции подобия строк для поиска поврежденных данных в моей базе данных. Я наткнулся на несколько из них: Jaro, Jaro-Winkler, Levenshtein, Euclidean и Q-gram, я хотел знать, что такое...
вопрос задан: 30 March 2012 10:36
0
ответов

Архитектура и основные компоненты механизма рекомендаций StumbleUpon

Я хотел бы знать, как stumbleupon рекомендует статьи для своих пользователей ?. Использует ли он нейронную сеть или какие-то алгоритмы машинного обучения, или он действительно рекомендует статьи, основанные на ...
вопрос задан: 30 March 2012 09:18
0
ответов

Подсчитайте, сколько повторяющихся символов содержится в двух строках.

Весь последний час я ломал голову, пытаясь понять, как это сделать. Думаю, это больше логический вопрос, чем технический. У меня есть две строки, и я хочу посчитать, сколько в них символов...
вопрос задан: 21 March 2012 04:04
0
ответов

Libpuzzle Индексация миллионов картинок?

речь идет о библиотеке libpuzzle для php ( http://libpuzzle.pureftpd.org/project/libpuzzle ) от Mr. Frank Denis. Я пытаюсь понять, как индексировать и хранить данные в моей базе данных mysql. ...
вопрос задан: 14 March 2012 14:44
0
ответов

Расстояние Хэмминга/Поиск подобия в базе данных

У меня есть процесс, похожий на tineye, который генерирует перцептивные хэши, это 32-битные целые числа. Я намерен хранить их в базе данных sql (, возможно, в базе данных nosql )в будущем. Однако я в тупике от того, как я...
вопрос задан: 7 March 2012 17:42
0
ответов

Java. Сравните сходство структуры (дом) веб-страниц.

Есть ли библиотека (для java), которая сравнивает сходство между веб-страницами (HTML, сходство dom)? В своем приложении я хочу классифицировать ссылки веб-сайта. Например: группа 1: страница сведений о продукте ...
вопрос задан: 17 January 2012 10:03
0
ответов

Дайджест / хеш Python для определения схожести строк

Я ищу алгоритм, который может генерировать короткий (fx 16 символов (не важно) хэш-код / ​​дайджест из более длинной строки . Основное требование состоит в том, что строки, которые почти идентичны, должны приводить к ...
вопрос задан: 13 January 2012 18:22
0
ответов

Явный семантический анализ

Я наткнулся на термин под названием «Явный семантический анализ», который использует Википедию в качестве справочного материала, находит сходство в документах и ​​классифицирует их (поправьте меня если я ошибаюсь). ...
вопрос задан: 3 January 2012 03:33
0
ответов

Библиотека Java для сравнения сходства изображений [закрыто]

Я потратил некоторое время на поиск библиотеки, которая позволяет мне сравнивать изображения друг с другом на Java. Я не нашел ничего полезного, возможно, мои навыки поиска в Google недостаточно высоки, поэтому я ...
вопрос задан: 27 December 2011 02:00
0
ответов

что является хорошей метрикой для определения того, являются ли 2 строки «достаточно похожими»

Я работаю над очень грубым алгоритмом первого наброска, чтобы определить, насколько похожи 2 строки. Я также использую расстояние Левенштейна для расчета расстояния редактирования между строками. Что я делаю ...
вопрос задан: 11 December 2011 22:37
0
ответов

Объединение различных сходств для создания одного окончательного сходства

Я новичок в системах интеллектуального анализа данных и рекомендаций, теперь пытаюсь создать что-то вроде системы rec для пользователей, у которых есть такие параметры: город образование интерес. Чтобы вычислить сходство между ...
вопрос задан: 20 November 2011 13:28
0
ответов

Алгоритм поиска расстояния редактирования до всех подстрок

Даны 2 строки s и t. Мне нужно найти для каждой подстроки в s расстояние редактирования (расстояние Левенштейна) до t. На самом деле мне нужно знать для каждой позиции i в s, каково минимальное расстояние редактирования для всех ...
вопрос задан: 15 November 2011 16:49
0
ответов

Есть ли реализация идея описана в «Обнаружении близких дубликатов для веб-сканирования»

. Документ: http://www2007.org/papers/paper215.pdf. Мне просто интересно, есть ли какие-либо реализации главы 3 этого документа. Я имею в виду запросы среди больших наборов данных, а НЕ только симхеш (это просто ...
вопрос задан: 19 October 2011 20:25
0
ответов

Матрица сходства -> алгоритм векторов признаков?

Если у нас есть набор из M слов, и мы знаем сходство значений каждой пары слов заранее (иметь матрицу сходства M x M), какой алгоритм мы можем использовать для создания одного k-мерного бита ...
вопрос задан: 12 October 2011 09:52
0
ответов

Функция MySQL для проверка процента схожести между двумя текстами

Мне нужен код MySQL для проверки процента схожести между текстом, отправленным через форму против ряда текстов, хранящихся в базе данных MySQL. Я ищу хранимую процедуру MySQL, которая будет работать ...
вопрос задан: 12 October 2011 05:29
0
ответов

Алгоритм для поиска связанных слов в тексте

Я хотел бы иметь слово (например, «Apple») и обрабатывать текст (или, может быть, больше). Я хотел бы придумать связанные термины. Например: обработайте документ для Apple и обнаружите, что iPod, iPhone, Mac ...
вопрос задан: 25 September 2011 07:39
0
ответов

Как получить попарную «оценку сходства последовательностей» для ~ 1000 белков?

У меня есть большое количество белковых последовательностей в формате fasta. Я хочу получить оценку попарного сходства последовательностей для каждой пары белков. Любой пакет в R может быть использован для взрыва ...
вопрос задан: 30 June 2011 13:20
0
ответов

сравнить короткие строки на разных языках на предмет похожего звучания - является ли Soundex ответом?

Как я могу получить «рейтинг» сходства звука для строки, написанной на одном языке, с другой строкой на другом язык: т.е. алгоритм, который определит, что "Дэвид Леттерман" и "דוד לטרמן" ...
вопрос задан: 26 May 2011 15:18
0
ответов

Оценка сходства - Левенштейн

Я реализовал алгоритм Левенштейна на Java и теперь получаю исправления, внесенные алгоритмом, также известные как стоимость. Это немного помогает, но не сильно, так как я хочу получить результаты в процентах ....
вопрос задан: 22 May 2011 11:50
0
ответов

Сходство Wordnet в Java: JAWS, JWNL или Java WN :: Similarity?

Мне нужно использовать Wordnet в приложении на основе Java. Я хочу: искать в синсетах найти сходство / взаимосвязь между наборами synset. Мое приложение использует графики RDF, и я знаю, что есть конечные точки SPARQL с Wordnet, но я ...
вопрос задан: 12 May 2011 10:19
0
ответов

Алгоритмы схожести текста

Я делаю Java-проект, в котором я придётся сделать программу подобия текста. Я хочу взять 2 текстовых документа, затем сравните их друг с другом и получите сходство. Насколько они похожи на ...
вопрос задан: 26 April 2011 17:29
0
ответов

Импортировать существующий проект Android в Eclipse: no gen исходная папка?

Я пытаюсь импортировать проект Android в Eclipse (из Git, но я не думаю, что это актуально), и я не могу запустить или скомпилировать его, потому что получаю следующие ошибки: Android требует соответствия компилятора уровень ...
вопрос задан: 16 March 2011 08:57
0
ответов

Сходство строк в PHP: функция типа levenshtein для длинных строк

Функция levenshtein в PHP работает со строками с максимальной длиной 255. Какие есть хорошие альтернативы для вычисления оценки подобия предложений в PHP. В основном у меня есть база данных предложений, ...
вопрос задан: 23 February 2011 15:35
0
ответов

Оценка / хеш схожести строк

Есть ли метод для вычисления чего-то вроде общей «оценки схожести» строки? Таким образом, я не сравниваю две строки вместе, а скорее получаю некоторое число (хэш) для каждой строки, которая может ...
вопрос задан: 1 December 2010 11:44
0
ответов

n-gram sentence similarity with cosine similarity measurement

I have been working on a project about sentence similarity. I know it has been asked many times in SO, but I just want to know if my problem can be accomplished by the method I use by the way that I ...
вопрос задан: 27 October 2010 21:01
0
ответов

Как найти похожее слово для слова с ошибкой в ​​PHP?

Я объясню свою проблему : У меня есть таблица базы данных с названием страны. В нем два столбца: ID и имя. Когда я хочу выполнить поиск по запросу «париж», но неправильно написал слово «pares» («е» вместо «i»), я не буду…
вопрос задан: 24 October 2010 17:14
0
ответов

Как заставить цвета на одном экране выглядеть одинаково как другой

Учитывая два отдельных компьютера, как можно было гарантировать, что цвета проектируются примерно то же на каждом экране? IE, один экран мог бы иметь 50%-ю яркость больше, чем другой, таким образом, цвета появляются...
вопрос задан: 18 October 2010 14:04