Я хотел бы попросить немного внимания к этой задаче.
Мое намерение состоит в том, чтобы найти какое-то решение для разработки в рамках системы.
В бизнесе моей компании (гражданское строительство )у меня следующий сценарий:
У нас есть элементы / материалы, зарегистрированные в нашей базе данных, но тысячи наших поставщиков имеют одни и те же элементы / материалы с разными названиями, но похожими.
Итак, у меня есть список элементов (, например.цемент ), полученный из счета через XML.
С другой стороны, у меня в базе данных зарегистрированы однотипные элементы, но с другим именем (, в большинстве случаев они почти равны ), и я хочу выяснить в списке счетов-фактур, что больше похоже на сравнение их имен.
Есть ли аналог байесовского алгоритма, в котором я мог бы сравнивать имена и иметь значение между «0» и «1»? Где «1» будет 100% идентичными символами.
Пример (Я изменю тип элементов для фруктов):
Если мне нужно сравнить:малина
Invoice List - Values of Algortim
---------------------------------
strawberry........ 0,89
blueberry......... 0,77
cherry............ 0,46
grape............. 0,11
raspberry......... 1,00
pineapple......... 0,13
Важно найти ближайшее имя, когда у меня нет идеальной комбинации.
Есть другие методики?
Было бы приятно увидеть, что вы, ребята, имеете в виду!