вы можете посмотреть на NLTK (набор инструментов Natural Language Toolkit), в частности на пакет nltk.metrics , который реализует различные алгоритмы строковых расстояний, включая упомянутое расстояние Левенштейна уже.