Мне было интересно, как лучше преобразовать что-то вроде "haaaaapppppyyy" в "haappyy".
По сути, при анализе сленга люди иногда повторяют символы для дополнительного акцента.
Мне интересно, как лучше всего это сделать? Использование set()
не работает, потому что порядок букв, очевидно, важен.
Есть идеи? Я использую Python + nltk.