SimMetrics, вероятно, в чем Вы нуждаетесь: http://sourceforge.net/projects/simmetrics/
Это имеет несколько алгоритмов для вычисления различных ароматов расстояния редактирования.
Lucene является очень мощным механизмом полнотекстового поиска, но поиск FT не является точно тем же самым как нечетким сопоставлением строк (например, учитывая список строк находят меня той, которая является самой подобной некоторой строке кандидата).
Палата общин Lang имеет реализацию расстояние Левенштейна .
Apache Lucene является единственным путем, я думаю. Я не знаю лучшего поискового lib.
Apache Lucene(TM) является высокоэффективной, полнофункциональной текстовой библиотекой поисковой системы, записанной полностью в Java. Это - технология, подходящая почти для любого приложения, которое требует полнотекстового поиска, особенно межплатформенного.
Вы можете попробовать растровое изображение. Я играл с битовой картой, написанной на ANSI C, и это было довольно быстро, реализация Java есть в http://www.crosswire.org .