lxml - список вопросов по программированию lxml

2

ответа

Замена элементов с lxml.html

Я довольно плохо знаком с lxml и Синтаксическими анализаторами HTML в целом. Я задавался вопросом, существует ли способ заменить элемент в дереве с другим элементом... Например, я имею: тело =""" <код> определение...

python lxml

вопрос задан: 28 November 2009 15:22

2

ответа

Для lxml действительно ли возможно работать нечувствительным к регистру способом?

Я пытаюсь очистить ключевые слова META и теги описания с произвольных веб-сайтов. Я, очевидно, не имею никакого контроля над упомянутым веб-сайтом, поэтому должны взять то, что мне дают. У них есть множество оболочки для...

вопрос задан: 14 November 2009 12:35

2

ответа

Как получить путь элемента в lxml?

Я ищу в документе HTML с помощью XPath от lxml в Python. Как я могу получить путь к определенному элементу? Вот пример от рубина nokogiri: page.xpath ('//текст ()') .each делают |textnode |...

python xpath lxml

вопрос задан: 16 October 2009 10:24

2

ответа

Clojure, эквивалентный lxml библиотеке Python?

Я ищу эквивалент Clojure/Java lxml библиотеке Python. Я использовал его тонна в прошлом для парсинга всех видов HTML (как замена для BeautifulSoup), и замечательно быть в состоянии к...

java python clojure lxml

вопрос задан: 15 October 2009 03:59

2

ответа

Как получить lxml, работающий под IronPython?

Я должен портировать некоторый код, который полагается в большой степени на lxml от приложения CPython до IronPython. lxml, очень Pythonic, и я хотел бы продолжать использовать его под IronPython, но это зависит от libxslt и...

.net xml ironpython python lxml

вопрос задан: 29 July 2009 14:36

2

ответа

Создание типа документа с помощью lxml etree

Я хочу добавить doctypes в мои документы XML, которые я генерирую с помощью etree LXML. Однако я не могу понять, как добавить тип документа. Жесткое кодирование и объединение строки не вариант. Я был ...

elementtree lxml doctype python

вопрос задан: 14 June 2009 00:41

2

ответа

Как проанализировать уродливый HTML в Python

Я должен просмотреть дерево DOM проанализированного документа HTML. Я использую uTidyLib прежде, чем проанализировать строку с lxml = tidy.parseString (html_code, опции) dom = etree.fromstring (ул. (a)) иногда я...

python html lxml

вопрос задан: 24 May 2009 20:59

2

ответа

Как соответствовать текстовому узлу, тогда следуют за родительскими узлами с помощью XPath

Я пытаюсь проанализировать некоторый HTML с XPath. После упрощенного примера XML ниже, я хочу соответствовать строке 'текст 1', затем захватить содержание соответствующего узла содержания. <документ> <...

lxml xpath html python

вопрос задан: 28 February 2009 21:33

2

ответа

Почему не делает работы xpath при обработке документа XHTML с lxml (в Python)?

Я тестирую против следующего тестового документа: <? версия xml = "1.0" кодирование = "UTF-8"?> <! ОБЩЕСТВЕННОСТЬ HTML DOCTYPE "-//W3C//DTD XHTML 1.0, Строгий//EN" "http://www.w3.org/TR/...

python xml xhtml xpath lxml

вопрос задан: 17 November 2008 22:54

2

ответа

Используя каталог XML с lxml Python?

Существует ли путь, когда я анализирую XML-документ с помощью lxml, для проверки того документа против его DTD с помощью внешнего файла каталога? Я должен смочь работать фиксированные атрибуты, определенные в...

lxml xml python

вопрос задан: 15 August 2008 18:42

1

ответ

Действительно ли возможно использовать Python lxml на Google App Engine?

Я могу использовать Python lxml на Google App Engine? (или я должен использовать Красивый Суп?) Я начал использовать Красивый Суп, но это кажется медленным. Я только начинаю играть с идеей "анализа экранных данных"...

python google-app-engine beautifulsoup lxml

вопрос задан: 11 October 2019 12:22

1

ответ

lxml find не возвращает элемент

Я пытаюсь разобрать и получить элемент из xml-файла с помощью lxml. < корень > & Л; > & Л; б > < / корень > print (root.find ("a")) --- Нет для дочернего элемента в корне: print child --- a --- b I '...

python lxml

вопрос задан: 27 March 2019 02:09

1

ответ

Как добавить недостающие библиотеки c для установки lxml в cygwin?

Я использую Cygwin для Python. Я не могу установить lxml, так как в некоторых библиотеках отсутствует ошибка. создание tmp cc -I / usr / include / libxml2 -c /tmp/xmlXPathInit94yfjj.c -o tmp / ...

python-2.7 gcc pip cygwin lxml

вопрос задан: 19 March 2019 20:33

1

ответ

Установка атрибута для документа XML с использованием lxml

Я пытаюсь создать файл XML, в котором мой главный узел имеет некоторые атрибуты: < cbnp-message: cbnp-message xmlns: cbnp-message = "some_value" xmlns = "some_value2" > Я пытаюсь добиться этого, используя ...

xml python-3.x lxml

вопрос задан: 19 March 2019 10:28

1

ответ

Ошибка импорта с python-pptx

Я столкнулся с проблемой при установке python-pptx с conda в очищенной среде: conda install -c conda-forge python-pptx. После успешного завершения установки я попытался импортировать модуль pptx и ...

anaconda lxml conda python-pptx

вопрос задан: 17 March 2019 19:11

1

ответ

Используя LXML с Html, Requests и ETree, он дает все HTML-теги в дополнение к тексту, и я не знаю, почему

Следующий вопрос из этого: используя LXML с Html, Requests и ETree, он дает ссылки, но не позволяет мне искать ссылки для конкретного текста. Я хотел бы знать, какие у меня есть лучшие варианты и что ...

python web-scraping lxml

вопрос задан: 5 March 2019 18:29

1

ответ

Разбор нескольких пространств имен XML в python с использованием lxml

<? xml-stylesheet href = "/ Библиотека стилей / st / xslt / rss2.xsl" type = "text / xsl" media = "screen"? > < rss version = "2.0" xmlns: atom = "http://www.w3.org/2005/Atom" xmlns: ta = "http: //www.smartraveller.gov.au / ...

python xml parsing namespaces lxml

вопрос задан: 5 March 2019 12:16

1

ответ

etree вставьте атрибут узла в отфильтрованные потомки

Я обрабатываю XML-файл. Я хочу создать вывод в виде списка кортежей для массовой вставки в базу данных. проблема, которую я не могу достичь, это вставка @id из узла в выбранный ...

python xml lxml

вопрос задан: 22 February 2019 00:07

1

ответ

xml строковый литерал, записанный в файл, неверно отформатирован

Я использую следующий код для записи строковых литералов XML в файл XML. из lxml import etree parser = etree.XMLParser (remove_blank_text = True) tree = etree.parse ("test.xml", parser) root = tree ....

python lxml xml

вопрос задан: 20 February 2019 19:35

1

ответ

Unicode LXML Generator

Я начинающий программист Python. Я был увиден урок и хочу начать этот код. Помогите мне, пожалуйста, начать этот код. Проблема с Юникодом lxml. Я не мог понять, в чем проблема. Я пытаюсь это исправить ...

python lxml

вопрос задан: 20 February 2019 17:38

1

ответ

xpath lxml не может получить все элементы внутри тега ul html

У меня была проблема с lxml xpath, мой приведенный ниже пример кода используется для получения всех данных из тега Li внутри Ul с помощью xpath: "// * [@ id =" s-results-list-atf "] / Li / @ данных-асин». Странно, я только ...

python web-crawler lxml

вопрос задан: 17 January 2019 13:49

1

ответ

Есть ли способ для клиента облачного хранилища Google указать на «файловый объект» в облачном хранилище, который затем будет использоваться lxml?

С клиентом Google Cloud Storage я не смог прочитать файл Storage как объект, как того требует lxml.etree.parse. Я мог прочитать файл облачного хранилища как большой двоичный объект, но это не сработало с lxml. ...

lxml google-cloud-storage xslt python-3.x google-cloud-functions

вопрос задан: 17 January 2019 10:51

1

ответ

Использование lxml XSLT-вывода

Я использую Python и lxml. Я пытаюсь добавить результат преобразования XML в другой объект XML, что приводит к ошибке неверного типа. У меня есть два XML-файла, которые я хочу объединить в ...

python-3.x xslt lxml

вопрос задан: 16 January 2019 15:39

1

ответ

Python находит значение атрибута с lxml

Как я смогу получить значение data-sku с помощью lxml import html & lt; button data-e2e = "product-size" type = "button" class = "btn btn-default" data-price = "DKK 1,750.00 "data-sku =" ...

python lxml

вопрос задан: 14 July 2018 00:10

1

ответ

Ошибка установки libxml с использованием pip

] Это моя ошибка: (mysite) zjm1126 @ zjm1126-G41MT-S2 : ~ / zjm_test / mysite $ pip install lxml Загрузка / распаковка lxml Запуск setup.py egg_info для пакета lxml Сборка lxml версии 2.3. ...

lxml python pip

вопрос задан: 1 July 2018 17:12

1

ответ

Несколько Пространств имен XML в теге с LXML

Я пытаюсь пользоваться библиотекой Pythons LXML для создания файла GPX, который может быть считан продуктом Garmin Mapsource. Заголовок на их файлах GPX похож на это <? версия xml = "1.0" кодирование = "UTF-8"...

python xml lxml gpx

вопрос задан: 3 January 2018 03:12

1

ответ

Как найти рекурсивно для тега XML, использующего LXML?

<? версия xml = "1.0"?> <данные> <тест> <f1/> </тест> <test2> <test3> <f1/> </test3> </test2&...

python xml find lxml

вопрос задан: 1 January 2018 22:26

1

ответ

Удаление всех тегов javascript и тегов стиля из html с помощью python и модуля lxml

Я разбираю html-документ с помощью библиотеки http://lxml.de/. Пока я понял, как удалить теги из html-документа В lxml, как удалить тег, но сохранить все содержимое? но ...

python html lxml

вопрос задан: 23 May 2017 12:02

1

ответ

Python lxml - xpath не находит элементы [duplicate]

Я пытаюсь восстановить какой-то старый код (от другого автора), который, похоже, не находит результаты, как он использовал: суть проблемы - это фрагмент кода: import lxml.etree some_xml = open ('some ....

python-2.7 xpath lxml

вопрос задан: 25 November 2016 02:18

1

ответ

Кодирование в Python с lxml - сложное решение

Я должен загрузить и проанализировать веб-страницу с lxml и создать UTF-8 xml вывод. Я думаю, что схема в псевдокоде более иллюстративна: от lxml импортируют etree webfile = urllib2.urlopen (URL) корень = etree.parse (...

python lxml

вопрос задан: 16 November 2016 10:20