Алгоритм поиска сравнения между именами/персонажами

Я хотел бы попросить немного внимания к этой задаче.

Мое намерение состоит в том, чтобы найти какое-то решение для разработки в рамках системы.

В бизнесе моей компании (гражданское строительство )у меня следующий сценарий:

У нас есть элементы / материалы, зарегистрированные в нашей базе данных, но тысячи наших поставщиков имеют одни и те же элементы / материалы с разными названиями, но похожими.

Итак, у меня есть список элементов (, например.цемент ), полученный из счета через XML.

С другой стороны, у меня в базе данных зарегистрированы однотипные элементы, но с другим именем (, в большинстве случаев они почти равны ), и я хочу выяснить в списке счетов-фактур, что больше похоже на сравнение их имен.

Есть ли аналог байесовского алгоритма, в котором я мог бы сравнивать имена и иметь значение между «0» и «1»? Где «1» будет 100% идентичными символами.

Пример (Я изменю тип элементов для фруктов):

Если мне нужно сравнить:малина

Invoice List - Values of Algortim
---------------------------------
 strawberry........ 0,89
 blueberry......... 0,77
 cherry............ 0,46
 grape............. 0,11
 raspberry......... 1,00
 pineapple......... 0,13

Важно найти ближайшее имя, когда у меня нет идеальной комбинации.

Есть другие методики?

Было бы приятно увидеть, что вы, ребята, имеете в виду!

0
задан Shahbaz 18 July 2012 в 13:12
поделиться