8
ответов

Эффективный способ вычислить множество сходства строк, когда объем выборки является большим?

Скажем, то, что у Вас есть список 10 000 адресов электронной почты, и требуется найти то, что некоторые самые близкие "соседи" в этом списке - определены как адреса электронной почты, которые являются подозрительно близко к другому...
вопрос задан: 23 May 2017 11:53
7
ответов

Кратчайший путь для преобразования одного слова в другого

Для проекта Структур данных я должен найти кратчайший путь между двумя словами (как "кошка" и "собака"), изменив только одну букву за один раз. Нам дают список слов скрэббла для использования в нахождении нашего пути...
вопрос задан: 1 May 2015 05:37
7
ответов

Расстояние Левенштейна: как лучше обработать слова, подкачивающие положения?

Я имел некоторый успех, сравнивающий строки с помощью PHP levenshtein функция. Однако для двух строк, которые содержат подстроки, которые подкачали положения, алгоритм считает тех как целых новыми...
вопрос задан: 19 November 2010 09:41
5
ответов

Существует ли алгоритм расстояния редактирования, который принимает во внимание “перемещение блока”?

Я поместил "перемещение блока" в кавычки, потому что я не знаю, ли или каков технический термин должен быть. Просто знание, если бы существует технический термин для процесса, было бы очень полезно. Википедия...
вопрос задан: 18 May 2009 17:19
2
ответа

Расстояние Левенштейна в T-SQL

Я интересуюсь алгоритмом в T-SQL, вычисляющем расстояние Левенштейна.
вопрос задан: 5 September 2010 15:28
1
ответ

Поиск слов в длинной строке на расстоянии редактирования без учета пробелов

Я ищу алгоритм для эффективного поиска слов в пределах заданного расстояния редактирования в строке запроса, игнорируя при этом пробел. Например, Если слова, по которым мне нужно построить индекс: OHIO, ...
вопрос задан: 21 February 2019 04:13
1
ответ

Расстояние редактирования предложения на уровне слова

Есть ли алгоритм, который позволяет вам найти расстояние редактирования на уровне слова между двумя приговоры? Например, «Большая толстая собака» и «Большой дом с толстой собакой» имеют 1 замену, 3 вставки
вопрос задан: 23 November 2012 19:50
1
ответ

Как Вы реализуете расстояние Левенштейна в Delphi?

Я отправляю это в духе ответа на Ваши собственные вопросы. Вопрос, который я имел, был: Как я могу реализовать алгоритм Levenshtein для вычисления расстояния редактирования между двумя строками, как описано...
вопрос задан: 10 September 2008 18:13
0
ответов

Матрица замешивания в тензорном потоке с помощью SparseTensors?

Это возможно? Я классифицирую последовательности, конкретно фонемы в предложениях, поэтому мой вход - SparseTensor. Я должен вычислить точность с tf.edit_distance (расстояние Левенштейна, которое ...
вопрос задан: 13 July 2018 18:08
0
ответов

Java: Разница между двумя списками

Приложение моей компании по разведению кошек отслеживает колонну кошек. Периодически ему нужно сравнивать previousOrder с currentOrder (каждый из них является ArrayList ) и уведомлять обработчиков кошек о любых ...
вопрос задан: 23 May 2017 12:33
0
ответов

Расстояние между строками, только транспозиции [дубликат]

Возможный дубликат: Подсчет свопов, необходимых для преобразования одной перестановки в другую Я ищу алгоритм, который подсчитывал бы какое-то расстояние между строками, где разрешена только операция ...
вопрос задан: 23 May 2017 12:31
0
ответов

Быстрый (er) алгоритм определения длины самой длинной общей подпоследовательности (LCS)

Проблема: требуется длина LCS между двумя строками. Размер строк не превышает 100 символов. Алфавит - обычный ДНК, 4 символа «ACGT». Динамический подход не быстрый ...
вопрос задан: 23 May 2017 12:10
0
ответов

Выясните, действительно ли название компании похоже на другое - Python

Я работаю с большой базой данных предприятий. Я хотел бы иметь возможность сравнить два названия компании на предмет схожести, чтобы увидеть, могут ли они быть дубликатами.Ниже приведен список названий компаний, которые ...
вопрос задан: 8 November 2016 23:18
0
ответов

Как нормализовать расстояние Левенштейна для максимальной длины выравнивания, а не для длины строки?

Проблема: В нескольких пакетах R есть реализации расстояния Левенштейна для вычисления подобия двух строк, например. http://finzi.psych.upenn.edu/R/library/RecordLinkage/html/strcmp.html. ...
вопрос задан: 20 June 2014 11:30
0
ответов

Показатели сходства на основе сравнения строк в R (расстояние редактирования)

Я пытаюсь присвоить оценку сходства на основе сравнения двух строк. Есть ли такая же функция в R. Я знаю о такой функции в SAS под названием SPEDIS. Пожалуйста, дайте мне знать, если...
вопрос задан: 17 May 2014 21:03
0
ответов

наиболее эффективное расстояние редактирования для выявления опечаток в именах?

Алгоритмы расстояния редактирования дают меру расстояния между двумя строками. Вопрос :, какая из этих мер будет наиболее уместной для обнаружения двух разных имен людей, которые на самом деле являются...
вопрос задан: 12 August 2012 09:11
0
ответов

Быстрое сравнение строки с коллекцией в Java

Я пытаюсь вычислить расстояния редактирования строки по отношению к коллекции, чтобы найти наиболее близкое совпадение. Моя текущая проблема заключается в том, что коллекция очень большая (около 25000 элементов), поэтому мне пришлось сузить круг ...
вопрос задан: 4 February 2012 09:19
0
ответов

Алгоритм поиска расстояния редактирования до всех подстрок

Даны 2 строки s и t. Мне нужно найти для каждой подстроки в s расстояние редактирования (расстояние Левенштейна) до t. На самом деле мне нужно знать для каждой позиции i в s, каково минимальное расстояние редактирования для всех ...
вопрос задан: 15 November 2011 16:49
0
ответов

Кратчайшая последовательность операций преобразования одного файлового дерева в другое

Возможно ли это при наличии двух файловых деревьев A и B для определения кратчайшей последовательности операций или короткой последовательности операций, необходимой для преобразования A в B? Операция может быть следующей: ...
вопрос задан: 10 August 2011 17:34
0
ответов

Формула расстояния Левенштейна в CoffeeScript?

Я пытаюсь создать или найти в CoffeeScript реализацию формулы расстояния Левенштейна, также известной как «Редактировать расстояние». Вот то, что у меня есть до сих пор, любая помощь будет очень благодарна.levenshtein = ...
вопрос задан: 10 July 2011 00:36
0
ответов

Как мне вычислить «разницу» между двумя последовательностями точек?

У меня есть две последовательности длины n и m. Каждая представляет собой последовательность точек формы (x, y) и представляет кривые в image. Мне нужно выяснить, насколько разные (или похожие) эти последовательности даны в данном факте ...
вопрос задан: 20 June 2011 21:55