От завершенного HTML-> к регулярному HTML? - Python

Question

Я использовал BeautifulSoup для обработки XML-файлов, которые я собрал через API REST.

Ответы содержат HTML-код, но BeautifulSoup выходит из всех HTML-тэгов, таким образом, он может быть отображен приятно.

К сожалению, мне нужен HTML-код.

Как я продолжил бы о преобразовании завершенного HTML в надлежащую разметку?

Справка очень ценилась бы!

6

задан RadiantHex 19 March 2010 в 04:25

2 ответа

Вы можете попробовать модуль urllib ?

В нем есть метод unquote () , который может удовлетворить ваши потребности.

Изменить: если подумать (и еще раз прочитать свой вопрос), вы можете просто использовать string.replace ()

Вот так:

string.replace('&lt;','<')
string.replace('&gt;','>')

2

ответ дан 8 December 2019 в 16:01

Другие вопросы по тегам: