Сопоставление нечетких строк

У меня есть две таблицы, которые мне нужно объединить в PostgreSQL, по общей переменной «название компании». К сожалению, многие из этих таблиц) названия компаний не совпадают в точности (например, MICROSOFT в одной таблице, MICROSFT в другой). Я попытался удалить общие слова из обоих столбцов, такие как "corporation", "inc" или "ltd", чтобы попытаться стандартизировать названия в обеих таблицах, но мне сложно придумать дополнительные стратегии. Есть идеи?

Спасибо.

Кроме того, при необходимости я могу сделать это в R.

8
задан aesir 19 January 2012 в 16:25
поделиться