TomC рекомендует разбивать символы Unicode на входе и перекомпоновывать на выходе ( http://www.perl.com/pub/2012/04/perl-unicode-cookbook- always-decompose-and-recompose.html).
Первое мне кажется совершенно логичным, но я не понимаю, почему он рекомендует перекомпоновать на выходе. Потенциально вы могли бы сэкономить небольшое количество места, если ваш текст перегружен символами с европейским акцентом, но вы просто перекладываете это на чью-то другую функцию декомпозиции.
Есть ли какие-то другие очевидные причины, по которым я упускаю?