Fuzzy Text Matching C#

Я пишу настольный пользовательский интерфейс (.Net WinForms) для помощи фотографу в очистке метаданных его изображений. Есть список из 66k+ фраз. Может ли кто-нибудь предложить хороший компонент .NET с открытым исходным кодом или бесплатный, который бы использовал какой-то алгоритм для определения потенциальных кандидатов на объединение? Например, могут быть две или более записи, которые на самом деле являются одним и тем же словом или фразой, отличающиеся только пробелами, пунктуацией или даже небольшими ошибками в написании. В конечном счете, приложение будет полагаться на действия пользователя по объединению фраз, но наличие эффективного способа автоматического поиска потенциальных кандидатов окажется неоценимым.

19
задан nathanchere 2 December 2013 в 09:30
поделиться