Удалить повторяющиеся символы из слов

Мне было интересно, как лучше преобразовать что-то вроде "haaaaapppppyyy" в "haappyy".

По сути, при анализе сленга люди иногда повторяют символы для дополнительного акцента.

Мне интересно, как лучше всего это сделать? Использование set()не работает, потому что порядок букв, очевидно, важен.

Есть идеи? Я использую Python + nltk.

8
задан Olli 13 March 2014 в 17:59
поделиться