2
ответа

Замена элементов с lxml.html

Я довольно плохо знаком с lxml и Синтаксическими анализаторами HTML в целом. Я задавался вопросом, существует ли способ заменить элемент в дереве с другим элементом... Например, я имею: тело =""" <код> определение...
вопрос задан: 28 November 2009 15:22
2
ответа

Для lxml действительно ли возможно работать нечувствительным к регистру способом?

Я пытаюсь очистить ключевые слова META и теги описания с произвольных веб-сайтов. Я, очевидно, не имею никакого контроля над упомянутым веб-сайтом, поэтому должны взять то, что мне дают. У них есть множество оболочки для...
вопрос задан: 14 November 2009 12:35
2
ответа

Как получить путь элемента в lxml?

Я ищу в документе HTML с помощью XPath от lxml в Python. Как я могу получить путь к определенному элементу? Вот пример от рубина nokogiri: page.xpath ('//текст ()') .each делают |textnode |...
вопрос задан: 16 October 2009 10:24
2
ответа

Clojure, эквивалентный lxml библиотеке Python?

Я ищу эквивалент Clojure/Java lxml библиотеке Python. Я использовал его тонна в прошлом для парсинга всех видов HTML (как замена для BeautifulSoup), и замечательно быть в состоянии к...
вопрос задан: 15 October 2009 03:59
2
ответа

Как получить lxml, работающий под IronPython?

Я должен портировать некоторый код, который полагается в большой степени на lxml от приложения CPython до IronPython. lxml, очень Pythonic, и я хотел бы продолжать использовать его под IronPython, но это зависит от libxslt и...
вопрос задан: 29 July 2009 14:36
2
ответа

Создание типа документа с помощью lxml etree

Я хочу добавить doctypes в мои документы XML, которые я генерирую с помощью etree LXML. Однако я не могу понять, как добавить тип документа. Жесткое кодирование и объединение строки не вариант. Я был ...
вопрос задан: 14 June 2009 00:41
2
ответа

Как проанализировать уродливый HTML в Python

Я должен просмотреть дерево DOM проанализированного документа HTML. Я использую uTidyLib прежде, чем проанализировать строку с lxml = tidy.parseString (html_code, опции) dom = etree.fromstring (ул. (a)) иногда я...
вопрос задан: 24 May 2009 20:59
2
ответа

Как соответствовать текстовому узлу, тогда следуют за родительскими узлами с помощью XPath

Я пытаюсь проанализировать некоторый HTML с XPath. После упрощенного примера XML ниже, я хочу соответствовать строке 'текст 1', затем захватить содержание соответствующего узла содержания. <документ> <...
вопрос задан: 28 February 2009 21:33
2
ответа

Почему не делает работы xpath при обработке документа XHTML с lxml (в Python)?

Я тестирую против следующего тестового документа: <? версия xml = "1.0" кодирование = "UTF-8"?> <! ОБЩЕСТВЕННОСТЬ HTML DOCTYPE "-//W3C//DTD XHTML 1.0, Строгий//EN" "http://www.w3.org/TR/...
вопрос задан: 17 November 2008 22:54
2
ответа

Используя каталог XML с lxml Python?

Существует ли путь, когда я анализирую XML-документ с помощью lxml, для проверки того документа против его DTD с помощью внешнего файла каталога? Я должен смочь работать фиксированные атрибуты, определенные в...
вопрос задан: 15 August 2008 18:42
1
ответ

Действительно ли возможно использовать Python lxml на Google App Engine?

Я могу использовать Python lxml на Google App Engine? (или я должен использовать Красивый Суп?) Я начал использовать Красивый Суп, но это кажется медленным. Я только начинаю играть с идеей "анализа экранных данных"...
вопрос задан: 11 October 2019 12:22
1
ответ

lxml find не возвращает элемент

Я пытаюсь разобрать и получить элемент из xml-файла с помощью lxml. < корень > & Л; > & Л; б > < / корень > print (root.find ("a")) --- Нет для дочернего элемента в корне: print child --- a --- b I '...
вопрос задан: 27 March 2019 02:09
1
ответ

Как добавить недостающие библиотеки c для установки lxml в cygwin?

Я использую Cygwin для Python. Я не могу установить lxml, так как в некоторых библиотеках отсутствует ошибка. создание tmp cc -I / usr / include / libxml2 -c /tmp/xmlXPathInit94yfjj.c -o tmp / ...
вопрос задан: 19 March 2019 20:33
1
ответ

Установка атрибута для документа XML с использованием lxml

Я пытаюсь создать файл XML, в котором мой главный узел имеет некоторые атрибуты: < cbnp-message: cbnp-message xmlns: cbnp-message = "some_value" xmlns = "some_value2" > Я пытаюсь добиться этого, используя ...
вопрос задан: 19 March 2019 10:28
1
ответ

Ошибка импорта с python-pptx

Я столкнулся с проблемой при установке python-pptx с conda в очищенной среде: conda install -c conda-forge python-pptx. После успешного завершения установки я попытался импортировать модуль pptx и ...
вопрос задан: 17 March 2019 19:11
1
ответ

Используя LXML с Html, Requests и ETree, он дает все HTML-теги в дополнение к тексту, и я не знаю, почему

Следующий вопрос из этого: используя LXML с Html, Requests и ETree, он дает ссылки, но не позволяет мне искать ссылки для конкретного текста. Я хотел бы знать, какие у меня есть лучшие варианты и что ...
вопрос задан: 5 March 2019 18:29
1
ответ

Разбор нескольких пространств имен XML в python с использованием lxml

<? xml-stylesheet href = "/ Библиотека стилей / st / xslt / rss2.xsl" type = "text / xsl" media = "screen"? > < rss version = "2.0" xmlns: atom = "http://www.w3.org/2005/Atom" xmlns: ta = "http: //www.smartraveller.gov.au / ...
вопрос задан: 5 March 2019 12:16
1
ответ

etree вставьте атрибут узла в отфильтрованные потомки

Я обрабатываю XML-файл. Я хочу создать вывод в виде списка кортежей для массовой вставки в базу данных. проблема, которую я не могу достичь, это вставка @id из узла в выбранный ...
вопрос задан: 22 February 2019 00:07
1
ответ

xml строковый литерал, записанный в файл, неверно отформатирован

Я использую следующий код для записи строковых литералов XML в файл XML. из lxml import etree parser = etree.XMLParser (remove_blank_text = True) tree = etree.parse ("test.xml", parser) root = tree ....
вопрос задан: 20 February 2019 19:35
1
ответ

Unicode LXML Generator

Я начинающий программист Python. Я был увиден урок и хочу начать этот код. Помогите мне, пожалуйста, начать этот код. Проблема с Юникодом lxml. Я не мог понять, в чем проблема. Я пытаюсь это исправить ...
вопрос задан: 20 February 2019 17:38
1
ответ

xpath lxml не может получить все элементы внутри тега ul html

У меня была проблема с lxml xpath, мой приведенный ниже пример кода используется для получения всех данных из тега Li внутри Ul с помощью xpath: "// * [@ id =" s-results-list-atf "] / Li / @ данных-асин». Странно, я только ...
вопрос задан: 17 January 2019 13:49
1
ответ

Есть ли способ для клиента облачного хранилища Google указать на «файловый объект» в облачном хранилище, который затем будет использоваться lxml?

С клиентом Google Cloud Storage я не смог прочитать файл Storage как объект, как того требует lxml.etree.parse. Я мог прочитать файл облачного хранилища как большой двоичный объект, но это не сработало с lxml. ...
вопрос задан: 17 January 2019 10:51
1
ответ

Использование lxml XSLT-вывода

Я использую Python и lxml. Я пытаюсь добавить результат преобразования XML в другой объект XML, что приводит к ошибке неверного типа. У меня есть два XML-файла, которые я хочу объединить в ...
вопрос задан: 16 January 2019 15:39
1
ответ

Python находит значение атрибута с lxml

Как я смогу получить значение data-sku с помощью lxml import html & lt; button data-e2e = "product-size" type = "button" class = "btn btn-default" data-price = "DKK 1,750.00 "data-sku =" ...
вопрос задан: 14 July 2018 00:10
1
ответ

Ошибка установки libxml с использованием pip

] Это моя ошибка: (mysite) zjm1126 @ zjm1126-G41MT-S2 : ~ / zjm_test / mysite $ pip install lxml Загрузка / распаковка lxml Запуск setup.py egg_info для пакета lxml Сборка lxml версии 2.3. ...
вопрос задан: 1 July 2018 17:12
1
ответ

Несколько Пространств имен XML в теге с LXML

Я пытаюсь пользоваться библиотекой Pythons LXML для создания файла GPX, который может быть считан продуктом Garmin Mapsource. Заголовок на их файлах GPX похож на это <? версия xml = "1.0" кодирование = "UTF-8"...
вопрос задан: 3 January 2018 03:12
1
ответ

Как найти рекурсивно для тега XML, использующего LXML?

<? версия xml = "1.0"?> <данные> <тест> <f1/> </тест> <test2> <test3> <f1/> </test3> </test2&...
вопрос задан: 1 January 2018 22:26
1
ответ

Удаление всех тегов javascript и тегов стиля из html с помощью python и модуля lxml

Я разбираю html-документ с помощью библиотеки http://lxml.de/. Пока я понял, как удалить теги из html-документа В lxml, как удалить тег, но сохранить все содержимое? но ...
вопрос задан: 23 May 2017 12:02
1
ответ

Python lxml - xpath не находит элементы [duplicate]

Я пытаюсь восстановить какой-то старый код (от другого автора), который, похоже, не находит результаты, как он использовал: суть проблемы - это фрагмент кода: import lxml.etree some_xml = open ('some ....
вопрос задан: 25 November 2016 02:18
1
ответ

Кодирование в Python с lxml - сложное решение

Я должен загрузить и проанализировать веб-страницу с lxml и создать UTF-8 xml вывод. Я думаю, что схема в псевдокоде более иллюстративна: от lxml импортируют etree webfile = urllib2.urlopen (URL) корень = etree.parse (...
вопрос задан: 16 November 2016 10:20