У меня есть следующая таблица с двумя столбцами: ID и Title, содержащая более 500 000 записей. Например:
ID Title
-- ------------------------
1 Aliens
2 Aliens (1986)
3 Aliens vs Predator
4 Aliens 2
5 The making of "Aliens"
Мне нужно найти записи, которые очень похожи, и под этим я подразумеваю, что они отличаются на 3-6 букв, обычно это различие находится в конце заголовков. Поэтому мне нужно разработать запрос, который возвращает записи no. 1,2 и 4. Я уже смотрел на расстояние Левенштейна, но не знаю, как его применить. Также из-за количества записей запрос не должен длиться всю ночь.
Спасибо за любую идею или предложение.