У меня есть куча файлов html, и мне нужно преобразовать и отформатировать их в текст с помощью perl, т.е. что-то вроде
будет преобразовано в \ n
Я нашел этот модуль perl в cpan html :: formattext, он хорошо форматирует текст, но если есть ссылка, он удаляет его, есть ли какой-либо вариант с HTML :: FormatText для форматирования html как текста, но когда там ссылки вроде этой
`
будет преобразовано в:
microsoft
http://www.microsoft.com