Расстояние левенштейна составляет мера для того, насколько похожие строки. Или, точнее, сколько изменений должно быть сделано, что они одинаковы.
Алгоритм доступен в псевдокоде в Википедии. Преобразование того, что в Java не должно быть проблемой, но не встроена в библиотеку базовой классы.
Wikipedia имеет еще несколько алгоритмов, которые измеряют сходство строк.
Да, это хорошая метрика, вы можете использовать StringUtil.GetlevenshteIndance () из Apache Commons