0
ответов

Расстояние Левенштейна в VBA [закрыто]

У меня есть таблица Excel с данными, которые я хочу получить Расстояние Левенштейна между ними. Я уже пробовал экспортировать как текст, прочитать из скрипта (php), запустить Левенштейна (вычислить расстояние Левенштейна), сохранить ...
вопрос задан: 7 July 2017 14:45
0
ответов

Алгоритм расстояния Левенштейна лучше, чем O (n * m)?

Я искал продвинутый алгоритм расстояния Левенштейна, и лучшее, что я нашел до сих пор, - это O (n * m), где n и m - длины двух строк. Причина, по которой алгоритм находится в этом ...
вопрос задан: 7 June 2017 05:18
0
ответов

Расстояние между строками, только транспозиции [дубликат]

Возможный дубликат: Подсчет свопов, необходимых для преобразования одной перестановки в другую Я ищу алгоритм, который подсчитывал бы какое-то расстояние между строками, где разрешена только операция ...
вопрос задан: 23 May 2017 12:31
0
ответов

Эффективно определить & ldquo; как отсортировано & rdquo; список есть, например. Расстояние Левенштейна

Я изучаю алгоритмы ранжирования и хотел бы, учитывая отсортированный список и некоторую перестановку этого списка, вычислить некоторое расстояние между двумя перестановками. Для случая ...
вопрос задан: 23 May 2017 12:00
0
ответов

Кластеризация текста с расстояниями Левенштейна

У меня есть набор (2k - 4k) небольших строк (3-6 символов), и я хочу их кластеризовать. Поскольку я использую строки, предыдущие ответы о том, как работает кластеризация (особенно кластеризация строк), сообщили мне, что ...
вопрос задан: 23 May 2017 10:31
0
ответов

как преобразовать строку в палиндром с минимальным количеством операций?

Вот состояния проблемы для преобразования строки в палиндром с минимальным количеством операций. Я знаю, что это похоже на расстояние Левенштейна, но я пока не могу его решить. Например, для ввода ...
вопрос задан: 18 March 2017 22:34
0
ответов

Как работают diff / patch и насколько они безопасны?

Относительно того, как они работают, мне было интересно работать на низком уровне: что вызовет конфликт слияния? Используется ли контекст также инструментами для применения патча? Как они справляются с изменениями ...
вопрос задан: 10 November 2015 17:01
0
ответов

Получение наиболее близкого совпадения строк

Мне нужен способ сравнить несколько строк с тестовой строкой и вернуть строку, которая очень похожа на нее: ТЕСТОВАЯ СТРОКА: КОРИЧНЕВАЯ ЛИСА СКАЧИЛАСЬ НАД КРАСНОЙ КОРОВОЙ ВЫБОР А: КРАСНАЯ КОРОВА СДЕЛАНА НАД ...
вопрос задан: 13 November 2014 15:23
0
ответов

Как нормализовать расстояние Левенштейна для максимальной длины выравнивания, а не для длины строки?

Проблема: В нескольких пакетах R есть реализации расстояния Левенштейна для вычисления подобия двух строк, например. http://finzi.psych.upenn.edu/R/library/RecordLinkage/html/strcmp.html. ...
вопрос задан: 20 June 2014 11:30
0
ответов

Лучший способ в php найти наиболее похожие строки?

Черт, в PHP есть много строковых функций, таких как levenshtein, similar_text и soundex, которые могут сравнить строки на сходство. http://www.php.net/manual/en/function.levenshtein.php Что лучше ...
вопрос задан: 3 September 2013 03:46
0
ответов

Сортировка массива по «Расстоянию Левенштейна» с наилучшей производительностью в Javascript

Итак, у меня есть случайный массив имен javascript... [@larry, @nicholas, @notch] и т. д. Все они начинаются с символа @. Я хотел бы отсортировать их по расстоянию Левенштейна, чтобы те, что вверху...
вопрос задан: 26 August 2013 10:31
0
ответов

Левенштейн: MySQL + PHP

$ word = strtolower ($ _ GET ['term']); $ lev = 0; $ q = mysql_query ("ВЫБРАТЬ` термин` ИЗ `слов`"); а ($ r = mysql_fetch_assoc ($ q)) {$ r ['термин'] = strtolower ($ r ['термин']); $ lev = левенштейн (...
вопрос задан: 25 January 2013 12:15
0
ответов

Лучший метод машинного обучения для сопоставления строк продуктов

Вот загадка... У меня есть две базы данных с одними и теми же 50000+ электронных продуктов, и я хочу сопоставить продукты в одной базе данных с продуктами в другой. Однако названия продуктов не всегда совпадают....
вопрос задан: 16 August 2012 02:40
0
ответов

Сходство строк -> расстояние Левенштейна

Я использую алгоритм Левенштейна, чтобы найти сходство между двумя строками. Это очень важная часть программы, которую я делаю, поэтому она должна быть эффективной. Проблема в том, что алгоритм...
вопрос задан: 26 July 2012 18:02
0
ответов

Можно ли сделать расстояние Левенштейна в Excel, не прибегая к макросам?

Позволь мне объяснить. Мне нужно выполнить нечеткое сопоставление для компании, поэтому в ATM я использую калькулятор расстояния Левенштейна, а затем вычисляю процент сходства между двумя терминами. Если условия...
вопрос задан: 5 July 2012 13:10
0
ответов

Расстояние Дамерау-Левенштейна (Редактировать расстояние с транспозицией) c реализацией

Я реализовал расстояние Дамерау-Левенштейна в c++, но оно не дает правильного o/p для ввода (пантера, аорта) правильное o/p равно 4, но мой код дает 5..... int editdist(string s,string t,int...
вопрос задан: 24 May 2012 10:59
0
ответов

Процентный ранг совпадений с использованием сопоставления расстояния Левенштейна

Я пытаюсь сопоставить один поисковый термин со словарем возможных совпадений, используя алгоритм расстояния Левенштейна. Алгоритм возвращает расстояние, выраженное как количество необходимых операций...
вопрос задан: 1 May 2012 22:46
0
ответов

Динамический алгоритм автокоррекции текста

Я пишу программу автокоррекции, которая использует расстояние Левенштейна для исправления фразы длиной не более 64 символов на основе определенного словаря, содержащего 8000 слов. Словарь...
вопрос задан: 7 April 2012 08:08
0
ответов

Сравнение алгоритмов подобия

Я хочу использовать функции подобия строк для поиска поврежденных данных в моей базе данных. Я наткнулся на несколько из них: Jaro, Jaro-Winkler, Levenshtein, Euclidean и Q-gram, я хотел знать, что такое...
вопрос задан: 30 March 2012 10:36
0
ответов

Расстояние Левенштейна симметрично?

Мне сообщили, что расстояние Левенштейна симметрично. Когда я использовал инструмент Google diffMatchPatch, который среди прочего вычисляет расстояние Левенштейна, результаты не подразумевают, что расстояние Левенштейна равно ...
вопрос задан: 15 March 2012 14:39
0
ответов

что является хорошей метрикой для определения того, являются ли 2 строки «достаточно похожими»

Я работаю над очень грубым алгоритмом первого наброска, чтобы определить, насколько похожи 2 строки. Я также использую расстояние Левенштейна для расчета расстояния редактирования между строками. Что я делаю ...
вопрос задан: 11 December 2011 22:37
0
ответов

Точность поискового слова, возможно, с использованием расстояния Левенштейна

У меня есть Таблица mySQL, в которую люди добавляют свои имена и интересы. Я хочу использовать какое-то совпадение слов, которое проходит и находит либо 100% совпадение, либо полное совпадение. IV Я слышал о ...
вопрос задан: 6 December 2011 01:59
0
ответов

Алгоритм поиска расстояния редактирования до всех подстрок

Даны 2 строки s и t. Мне нужно найти для каждой подстроки в s расстояние редактирования (расстояние Левенштейна) до t. На самом деле мне нужно знать для каждой позиции i в s, каково минимальное расстояние редактирования для всех ...
вопрос задан: 15 November 2011 16:49
0
ответов

Сфинкс и «вы имели в виду…?» идея предложения. Будет ли это работать?

Я пытаюсь придумать самый быстрый способ делать предложения поиска. Сначала я думал, что UDF-функция Левенштейна в сочетании с таблицей mysql выполнит эту работу. Но используя levenshtein, mysql ...
вопрос задан: 23 October 2011 14:14
0
ответов

Улучшенный алгоритм Левенштейна

Недавно я внедрил алгоритм Левенштейна в базу данных нашей поисковой системы, но мы столкнулись с проблемой. Согласно базовому алгоритму Левенштейна Levenshtein('123456','12x456') это тот же ...
вопрос задан: 20 October 2011 20:49
0
ответов

Как отсортировать массив по сходству относительно введенного слова.

У меня есть массив PHP, например: $ arr = array ("hello", "try", "hel", "hey hello"); Теперь я хочу переупорядочить массив, который будет основан на наиболее близких словах между массивом и ...
вопрос задан: 28 August 2011 02:18
0
ответов

Как эффективно проверить если два символа являются соседями на клавиатуре?

Я хочу разработать программную клавиатуру для Android и уже получил алгоритм автозамены, который делает предложения, основанные на том, что вводимый символ и символ слова из словаря ...
вопрос задан: 16 August 2011 13:48
0
ответов

Как лучше всего сравнивать данные при импорте в базу данных?

У меня есть таблица базы данных MySQL, содержащая информацию примерно о 1000 магазинах. Теперь я буду импортировать больше магазинов, загрузив электронную таблицу Excel, и я стараюсь избегать дублирования. Магазины могут ...
вопрос задан: 28 July 2011 11:00
0
ответов

Формула расстояния Левенштейна в CoffeeScript?

Я пытаюсь создать или найти в CoffeeScript реализацию формулы расстояния Левенштейна, также известной как «Редактировать расстояние». Вот то, что у меня есть до сих пор, любая помощь будет очень благодарна.levenshtein = ...
вопрос задан: 10 July 2011 00:36
0
ответов

LevensteinDistance - Commons Lang 3.0 API

С помощью Commons Lang api я могу вычислить сходство между двумя строками с помощью LevensteinDistance. В результате получается количество изменений, необходимых для преобразования одной строки в другую. Я желаю результата ...
вопрос задан: 8 July 2011 23:38