Я лично использую реализацию CLR алгоритма Jaro-Winkler , который, похоже, работает очень хорошо - он немного борется со строками длиной более 15 символов и не любит сопоставлять адреса электронной почты, но в противном случае довольно неплохо - здесь можно найти полное руководство по реализации здесь
Если вы не можете использовать функции CLR по каким-либо причинам, возможно, вы можете попробовать запустить данные через пакет SSIS (используя поиск нечеткого преобразования) - подробный здесь