От завершенного HTML-> к регулярному HTML? - Python

Я использовал BeautifulSoup для обработки XML-файлов, которые я собрал через API REST.

Ответы содержат HTML-код, но BeautifulSoup выходит из всех HTML-тэгов, таким образом, он может быть отображен приятно.

К сожалению, мне нужен HTML-код.


Как я продолжил бы о преобразовании завершенного HTML в надлежащую разметку?


Справка очень ценилась бы!

6
задан RadiantHex 19 March 2010 в 04:25
поделиться

2 ответа

Думаю, вам нужен xml.sax.saxutils.unescape из стандартной библиотеки Python.

Например:

>>> from xml.sax import saxutils as su
>>> s = '<foo>bar</foo>'
>>> su.unescape(s)
'<foo>bar</foo>'
13
ответ дан 8 December 2019 в 16:01
поделиться

Вы можете попробовать модуль urllib ?

В нем есть метод unquote () , который может удовлетворить ваши потребности.

Изменить: если подумать (и еще раз прочитать свой вопрос), вы можете просто использовать string.replace ()

Вот так:

string.replace('&lt;','<')
string.replace('&gt;','>')
2
ответ дан 8 December 2019 в 16:01
поделиться
Другие вопросы по тегам:

Похожие вопросы: