Какой модуль CPAN Вы рекомендовали бы для того, чтобы превратить HTML в отформатированный простой текст?
Одно строгое требование - то, что модуль должен обработать символы Unicode.
Мне нравятся HTML :: FormatText и HTML :: FormatText :: WithLinks
См. пример сценария htext , который поставляется с HTML :: Parser .