Существует ли способ, которым я могу сделать что-то как следующее использование стандартного набора инструментальных средств Linux?
Скажем, источник по example.com/index.php:
Hello, & world! "
Как я могу сделать что-то вроде этого...
curl -s http://example.com/index.php | htmlentities
... это распечатало бы следующее:
Hello, & world! "
Только Используя стандартный набор инструментальных средств Linux?
Используйте перекодируйте
.
$ echo 'Hello, & world! "' | recode HTML_4.0
Hello, & world! "
РЕДАКТИРОВАТЬ : Кстати, recode
предлагает несколько различных преобразований, соответствующих различным версиям HTML и XML, поэтому вы можете использовать, например, HTML_3.2
вместо HTML_4.0
, если у вас действительно старый HTML-документ. Запуск recode -l
перечислит весь полный список кодировок, поддерживаемых программой.
alias decode="php -r 'echo html_entity_decode(fgets( STDIN ));'"
$ echo 'Hello, & world! "' | decode
Hello, & world! "