сравнить короткие строки на разных языках на предмет похожего звучания - является ли Soundex ответом?

Как я могу получить "оценку" звукового сходства для строки, написанной на одном языке, с другой строкой на другом языке: т.е. алгоритм, который определит, что

« Дэвид Леттерман » и « דוד לטרמן » - это строки, которые звучат одинаково.

-О, да, кстати, это иврит означает, вы догадались: "Дэвид Леттерман", То есть у меня нет фонем или фонетических транскрипций / переводов строк.

Я уже реализовал кое-что вроде настройки реализации Soundex, которая работает так себе. Это правильный путь?

8
задан RabinDev 26 May 2011 в 15:18
поделиться