Я могу изменить поведение BeautifulSoup относительно преобразования XML-тэгов к нижнему регистру?

попробуйте с

<?php $hostname = env("IMAP_HOSTNAME_TEST", "somedefaultvalue"); ?>
6
задан Community 23 May 2017 в 11:50
поделиться

4 ответа

По словам Леонарда Ричардсона, создателя | разработчика Beautiful Soup, вы не можете .

3
ответ дан 10 December 2019 в 00:44
поделиться
import html5lib
from html5lib import treebuilders

f = open("mydocument.html")
parser = html5lib.XMLParser(tree=treebuilders.getTreeBuilder("beautifulsoup"))
document = parser.parse(f)

«документ» теперь является деревом, подобным BeautifulSoup, но сохраняет регистры тегов. См. html5lib для документации и установки.

6
ответ дан 10 December 2019 в 00:44
поделиться

Взгляните в алфавитно-цифровом плагине jQuery. https://github.com/KevinSheedy/jquery.

0
ответ дан 10 December 2019 в 00:44
поделиться

Намного лучше использовать lxml . Это намного быстрее, чем BeautifulSoup. У него также есть API совместимости для BeautifulSoup, если вы не хотите изучать lxml API.

Ян Бликинг соглашается .

Нет причин использовать BeautifulSoup больше, если вы не используете Google App Engine или что-то, где не разрешено ничего, кроме Python.

Это также больше подходит для XML.

1
ответ дан 10 December 2019 в 00:44
поделиться
Другие вопросы по тегам:

Похожие вопросы: