Преобладающее количество документации и примеров NLTK посвящено лемматизации и основанию, но очень мало по таким вопросам нормализации, как:
Укажите, пожалуйста, где в НЛТК копать. Любые эквиваленты NLTK (JAVA или любые другие) для вышеупомянутых целей приветствуются. Спасибо.
UPD . Я написал библиотеку нормализации текста на Python для преобразования текста в речь https://github.com/soshial/text-normalization . Это может подойти и вам.