У меня есть два набора данных (t,y1) и (t,y2). Эти наборы данных визуально выглядят одинаково, но имеют некоторую временную задержку или сдвиг величины. я хочу найти сходство между двумя кривыми (с оценкой ...
Я хочу использовать функции подобия строк для поиска поврежденных данных в моей базе данных. Я наткнулся на несколько из них: Jaro, Jaro-Winkler, Levenshtein, Euclidean и Q-gram, я хотел знать, что такое...
Я хотел бы знать, как stumbleupon рекомендует статьи для своих пользователей ?. Использует ли он нейронную сеть или какие-то алгоритмы машинного обучения, или он действительно рекомендует статьи, основанные на ...
Весь последний час я ломал голову, пытаясь понять, как это сделать. Думаю, это больше логический вопрос, чем технический. У меня есть две строки, и я хочу посчитать, сколько в них символов...
речь идет о библиотеке libpuzzle для php ( http://libpuzzle.pureftpd.org/project/libpuzzle ) от Mr. Frank Denis. Я пытаюсь понять, как индексировать и хранить данные в моей базе данных mysql. ...
У меня есть процесс, похожий на tineye, который генерирует перцептивные хэши, это 32-битные целые числа. Я намерен хранить их в базе данных sql (, возможно, в базе данных nosql )в будущем. Однако я в тупике от того, как я...
Есть ли библиотека (для java), которая сравнивает сходство между веб-страницами (HTML, сходство dom)? В своем приложении я хочу классифицировать ссылки веб-сайта.
Например:
группа 1: страница сведений о продукте
...
Я ищу алгоритм, который может генерировать короткий (fx 16 символов (не важно) хэш-код / дайджест из более длинной строки . Основное требование состоит в том, что строки, которые почти идентичны, должны приводить к ...
Я наткнулся на термин под названием «Явный семантический анализ», который использует Википедию в качестве справочного материала, находит сходство в документах и классифицирует их (поправьте меня если я ошибаюсь). ...
Я потратил некоторое время на поиск библиотеки, которая позволяет мне сравнивать изображения друг с другом на Java. Я не нашел ничего полезного, возможно, мои навыки поиска в Google недостаточно высоки, поэтому я ...
Я работаю над очень грубым алгоритмом первого наброска, чтобы определить, насколько похожи 2 строки. Я также использую расстояние Левенштейна для расчета расстояния редактирования между строками. Что я делаю ...
Я новичок в системах интеллектуального анализа данных и рекомендаций, теперь пытаюсь создать что-то вроде системы rec для пользователей, у которых есть такие параметры: город
образование
интерес. Чтобы вычислить сходство между ...
Даны 2 строки s и t. Мне нужно найти для каждой подстроки в s расстояние редактирования (расстояние Левенштейна) до t. На самом деле мне нужно знать для каждой позиции i в s, каково минимальное расстояние редактирования для всех ...
. Документ: http://www2007.org/papers/paper215.pdf. Мне просто интересно, есть ли какие-либо реализации главы 3 этого документа. Я имею в виду запросы среди больших наборов данных, а НЕ только симхеш (это просто ...
Если у нас есть набор из M слов, и мы знаем сходство значений каждой пары слов заранее (иметь матрицу сходства M x M), какой алгоритм мы можем использовать для создания одного k-мерного бита ...
Мне нужен код MySQL для проверки процента схожести между текстом, отправленным через форму против ряда текстов, хранящихся в базе данных MySQL. Я ищу хранимую процедуру MySQL, которая будет работать ...
Я хотел бы иметь слово (например, «Apple») и обрабатывать текст (или, может быть, больше). Я хотел бы придумать связанные термины. Например: обработайте документ для Apple и обнаружите, что iPod, iPhone, Mac ...
У меня есть большое количество белковых последовательностей в формате fasta. Я хочу получить оценку попарного сходства последовательностей для каждой пары белков. Любой пакет в R может быть использован для взрыва ...
Как я могу получить «рейтинг» сходства звука для строки, написанной на одном языке, с другой строкой на другом язык: т.е. алгоритм, который определит, что "Дэвид Леттерман" и "דוד לטרמן" ...
Я реализовал алгоритм Левенштейна на Java и теперь получаю исправления, внесенные алгоритмом, также известные как стоимость. Это немного помогает, но не сильно, так как я хочу получить результаты в процентах ....
Мне нужно использовать Wordnet в приложении на основе Java.
Я хочу: искать в синсетах
найти сходство / взаимосвязь между наборами synset. Мое приложение использует графики RDF, и я знаю, что есть конечные точки SPARQL с Wordnet, но я ...
Я делаю Java-проект, в котором я придётся сделать программу подобия текста. Я хочу взять 2 текстовых документа, затем сравните их друг с другом и получите сходство. Насколько они похожи на ...
Я пытаюсь импортировать проект Android в Eclipse (из Git, но я не думаю, что это актуально), и я не могу запустить или скомпилировать его, потому что получаю следующие ошибки: Android требует соответствия компилятора уровень ...
Функция levenshtein в PHP работает со строками с максимальной длиной 255. Какие есть хорошие альтернативы для вычисления оценки подобия предложений в PHP. В основном у меня есть база данных предложений, ...
Есть ли метод для вычисления чего-то вроде общей «оценки схожести» строки? Таким образом, я не сравниваю две строки вместе, а скорее получаю некоторое число (хэш) для каждой строки, которая может ...
I have been working on a project about sentence similarity. I know it has been asked many times in SO, but I just want to know if my problem can be accomplished by the method I use by the way that I ...
Я объясню свою проблему : У меня есть таблица базы данных с названием страны. В нем два столбца: ID и имя. Когда я хочу выполнить поиск по запросу «париж», но неправильно написал слово «pares» («е» вместо «i»), я не буду…
Учитывая два отдельных компьютера, как можно было гарантировать, что цвета проектируются примерно то же на каждом экране? IE, один экран мог бы иметь 50%-ю яркость больше, чем другой, таким образом, цвета появляются...