Для lxml действительно ли возможно работать нечувствительным к регистру способом?

Существует Уполномочивать программа, которую имеет в наличии Microsoft. Это дает Вам несколько Premium подписки для дешевого с выгодой, что необходимо быть независимым поставщиком программного обеспечения, работающим для фактического продукта.

Это (Не доступный больше - неработающая ссылка) дает Вам все программное обеспечение, в котором Вы будете нуждаться для разработки, и даже нескольких лицензий "реального мира" на определенные приложения (как Office)

После нескольких лет, необходимо заплатить полную цену все же. Логика, являющаяся этим, Вы должны иметь продукт на рынке и можете предоставить его.

8
задан Mat 14 November 2009 в 12:35
поделиться

2 ответа

Значения атрибутов должны быть чувствительными к регистру.

Вы можете использовать произвольное регулярное выражение для выбора элемента:

#!/usr/bin/env python
from lxml import html

doc = html.fromstring('''
    <meta name="Description">
    <meta name="description">
    <META name="description">
    <meta NAME="description">
''')
for meta in doc.xpath('//meta[re:test(@name, "^description$", "i")]',
                      namespaces={"re": "http://exslt.org/regular-expressions"}):
    print html.tostring(meta, pretty_print=True),

Вывод:

<meta name="Description">
<meta name="description">
<meta name="description">
<meta name="description">
7
ответ дан 5 December 2019 в 19:00
поделиться

lxml - это синтаксический анализатор XML. XML чувствителен к регистру. Вы разбираете HTML, поэтому вам следует использовать анализатор HTML. BeautifulSoup очень популярен. Единственный недостаток в том, что он может работать медленно.

2
ответ дан 5 December 2019 в 19:00
поделиться
Другие вопросы по тегам:

Похожие вопросы: