Я довольно плохо знаком с lxml и Синтаксическими анализаторами HTML в целом. Я задавался вопросом, существует ли способ заменить элемент в дереве с другим элементом... Например, я имею: тело =""" <код> определение...
Я пытаюсь очистить ключевые слова META и теги описания с произвольных веб-сайтов. Я, очевидно, не имею никакого контроля над упомянутым веб-сайтом, поэтому должны взять то, что мне дают. У них есть множество оболочки для...
Я ищу в документе HTML с помощью XPath от lxml в Python. Как я могу получить путь к определенному элементу? Вот пример от рубина nokogiri: page.xpath ('//текст ()') .each делают |textnode |...
Я ищу эквивалент Clojure/Java lxml библиотеке Python. Я использовал его тонна в прошлом для парсинга всех видов HTML (как замена для BeautifulSoup), и замечательно быть в состоянии к...
Я должен портировать некоторый код, который полагается в большой степени на lxml от приложения CPython до IronPython. lxml, очень Pythonic, и я хотел бы продолжать использовать его под IronPython, но это зависит от libxslt и...
Я хочу добавить doctypes в мои документы XML, которые я генерирую с помощью etree LXML. Однако я не могу понять, как добавить тип документа. Жесткое кодирование и объединение строки не вариант. Я был ...
Я должен просмотреть дерево DOM проанализированного документа HTML. Я использую uTidyLib прежде, чем проанализировать строку с lxml = tidy.parseString (html_code, опции) dom = etree.fromstring (ул. (a)) иногда я...
Я пытаюсь проанализировать некоторый HTML с XPath. После упрощенного примера XML ниже, я хочу соответствовать строке 'текст 1', затем захватить содержание соответствующего узла содержания. <документ> <...
Я тестирую против следующего тестового документа: <? версия xml = "1.0" кодирование = "UTF-8"?> <! ОБЩЕСТВЕННОСТЬ HTML DOCTYPE "-//W3C//DTD XHTML 1.0, Строгий//EN" "http://www.w3.org/TR/...
Существует ли путь, когда я анализирую XML-документ с помощью lxml, для проверки того документа против его DTD с помощью внешнего файла каталога? Я должен смочь работать фиксированные атрибуты, определенные в...
Я могу использовать Python lxml на Google App Engine? (или я должен использовать Красивый Суп?) Я начал использовать Красивый Суп, но это кажется медленным. Я только начинаю играть с идеей "анализа экранных данных"...
Я пытаюсь разобрать и получить элемент из xml-файла с помощью lxml. < корень > & Л; > & Л; б > < / корень > print (root.find ("a")) --- Нет для дочернего элемента в корне: print child --- a --- b I '...
Я использую Cygwin для Python. Я не могу установить lxml, так как в некоторых библиотеках отсутствует ошибка. создание tmp cc -I / usr / include / libxml2 -c /tmp/xmlXPathInit94yfjj.c -o tmp / ...
Я пытаюсь создать файл XML, в котором мой главный узел имеет некоторые атрибуты: < cbnp-message: cbnp-message xmlns: cbnp-message = "some_value" xmlns = "some_value2" > Я пытаюсь добиться этого, используя ...
Я столкнулся с проблемой при установке python-pptx с conda в очищенной среде: conda install -c conda-forge python-pptx. После успешного завершения установки я попытался импортировать модуль pptx и ...
Следующий вопрос из этого: используя LXML с Html, Requests и ETree, он дает ссылки, но не позволяет мне искать ссылки для конкретного текста. Я хотел бы знать, какие у меня есть лучшие варианты и что ...
Я обрабатываю XML-файл. Я хочу создать вывод в виде списка кортежей для массовой вставки в базу данных. проблема, которую я не могу достичь, это вставка @id из узла в выбранный ...
Я использую следующий код для записи строковых литералов XML в файл XML. из lxml import etree parser = etree.XMLParser (remove_blank_text = True) tree = etree.parse ("test.xml", parser) root = tree ....
Я начинающий программист Python. Я был увиден урок и хочу начать этот код. Помогите мне, пожалуйста, начать этот код. Проблема с Юникодом lxml. Я не мог понять, в чем проблема. Я пытаюсь это исправить ...
У меня была проблема с lxml xpath, мой приведенный ниже пример кода используется для получения всех данных из тега Li внутри Ul с помощью xpath: "// * [@ id =" s-results-list-atf "] / Li / @ данных-асин». Странно, я только ...
С клиентом Google Cloud Storage я не смог прочитать файл Storage как объект, как того требует lxml.etree.parse. Я мог прочитать файл облачного хранилища как большой двоичный объект, но это не сработало с lxml. ...
Я использую Python и lxml. Я пытаюсь добавить результат преобразования XML в другой объект XML, что приводит к ошибке неверного типа. У меня есть два XML-файла, которые я хочу объединить в ...
Как я смогу получить значение data-sku с помощью lxml import html & lt; button data-e2e = "product-size" type = "button" class = "btn btn-default" data-price = "DKK 1,750.00 "data-sku =" ...
Я пытаюсь пользоваться библиотекой Pythons LXML для создания файла GPX, который может быть считан продуктом Garmin Mapsource. Заголовок на их файлах GPX похож на это <? версия xml = "1.0" кодирование = "UTF-8"...
Я разбираю html-документ с помощью библиотеки http://lxml.de/. Пока я понял, как удалить теги из html-документа В lxml, как удалить тег, но сохранить все содержимое? но ...
Я пытаюсь восстановить какой-то старый код (от другого автора), который, похоже, не находит результаты, как он использовал: суть проблемы - это фрагмент кода: import lxml.etree some_xml = open ('some ....
Я должен загрузить и проанализировать веб-страницу с lxml и создать UTF-8 xml вывод. Я думаю, что схема в псевдокоде более иллюстративна: от lxml импортируют etree webfile = urllib2.urlopen (URL) корень = etree.parse (...