1
ответ

Как использовать пространства имен xml с find / findall в lxml?

Я пытаюсь проанализировать содержимое в электронной таблице OpenOffice ODS . Формат ods - это, по сути, просто zip-файл с рядом документов. Содержимое электронной таблицы хранится в файле content.xml. ...
вопрос задан: 16 November 2015 23:03
1
ответ

как удалить атрибут etree Элемента?

У меня есть Элемент etree, имеющего некоторые атрибуты - как мы можем удалить атрибут конкретного etree Элемента.
вопрос задан: 10 February 2015 22:38
1
ответ

Как я соответствую содержанию элемента в XPath (lxml)?

Я хочу проанализировать HTML с lxml, использующим выражения XPath. Моя проблема соответствует для содержания тега: Например, данный <href = "http://something"> Пример </a> элемент я могу...
вопрос задан: 3 October 2014 19:32
1
ответ

Python: добавление пространств имен в lxml

Я пытаюсь указать пространство имен с помощью lxml подобный этому примеру (взятый отсюда): <TreeInventory xsi:noNamespaceSchemaLocation = "Trees.xsd" xmlns:xsi = "http://www.w3.org/2001/XMLSchema-...
вопрос задан: 14 May 2014 12:51
1
ответ

как удалить элемент в lxml

Мне нужно полностью удалить элементы на основе содержимого атрибута, используя lxml python. Пример: import lxml.etree as et xml = "" " apple
вопрос задан: 12 May 2013 02:57
1
ответ

Как извлечь ссылки из веб-страницы с помощью lxml, XPath и Python?

У меня есть этот запрос xpath:/html/body//tbody/tr [*]/td [*]/a [@title] / @href Это извлекает все ссылки с атрибутом заголовка - и дает href в дополнении средства проверки FireFox Xpath. Однако я не могу...
вопрос задан: 1 March 2013 17:20
1
ответ

Как установить lxml в Ubuntu

У меня возникают трудности при установке lxml с easy_install в Ubuntu 11. Когда я набираю $ easy_install lxml, я получаю: Поиск lxml Чтение http://pypi.python.org/simple/lxml/ Чтение http: // codespeak ....
вопрос задан: 14 November 2012 19:09
1
ответ

ошибка с синтаксическим анализом функционирует в lxml

я установил lxml2.2.2 на платформе окон (я m использование версии 2.6.5 Python).i, попробовал эту простую команду: из lxml.html импорт анализирует p = синтаксический анализ (‘http://www.google.com’) .getroot (), но я добираюсь...
вопрос задан: 23 January 2012 17:08
1
ответ

Parsing HTML with Lxml

I need help parsing out some text from a page with lxml. I tried beautifulsoup and the html of the page I am parsing is so broken, it wouldn't work. So I have moved on to lxml, but the docs are a ...
вопрос задан: 17 August 2011 21:25
1
ответ

Эквивалентно InnerHTML при использовании lxml.html для синтаксического анализа HTML

Я работаю над сценарием, использующим lxml.html для синтаксического анализа веб-страниц. В свое время я сделал немало BeautifulSoup, но теперь экспериментирую с lxml из-за его скорости. Я хотел бы знать, что больше всего ...
вопрос задан: 27 June 2011 17:39
1
ответ

Можно ли визуализировать XML без атрибутов пространства имен при использовании lxml?

Я генерирую некоторый XML с lxml и получаю такие узлы :
вопрос задан: 22 February 2011 12:23
1
ответ

Как я могу разобрать с lxml страницу результатов с формой?

Я пытаюсь разобрать вторичную страницу с формой. Я использую пример исходного кода по этой ссылке: http://blog.ianbicking.org/2007/09/24/lxmlhtml/ В моем тесте я использую этот URL: http://www.infofer.ro/ Как на ...
вопрос задан: 30 August 2010 14:23
1
ответ

Python setuptool, как я могу добавить зависимость для libxml2-dev и libxslt1-dev?

Моему приложению нужен lxml> = 2.1, но для установки lxml он необходим для установки libxml2-dev libxslt1-dev, в противном случае возникает ошибка при установке lxml, есть ли способ, с помощью которого я могу ...
вопрос задан: 16 August 2010 12:38
1
ответ

Как я могу удалить все элементы, соответствующие xpath в Python с помощью lxml?

Таким образом, у меня есть некоторый XML как это: <панель> <нечто> Что-то </нечто> <baz> <нечто> Привет </нечто> <столкновение> Другой </столкновение> <baz> <панель> И я хочу...
вопрос задан: 29 July 2010 02:49
1
ответ

python [lxml] - очистка HTML-тегов

из lxml.html.clean import clean_html, Cleaner def clean (text): try: cleaner = Cleaner (сценарии = True, встроенный = True, мета = True, page_structure = True, ссылки = True, стиль = ...
вопрос задан: 2 June 2010 00:28
1
ответ

Перепутанный для использования класса или функции: Запись XML-файлов с помощью lxml и Python

Я должен записать XML-файлы с помощью lxml и Python. Однако я не могу выяснить, использовать ли класс, чтобы сделать это или функцию. Точка быть, это - первый раз, когда я разрабатываю надлежащее программное обеспечение...
вопрос задан: 23 May 2010 16:33
1
ответ

Найдите элементы на основе типа xsd с lxml

Я пытаюсь получить список элементов с определенным типом xsd с lxml 2.x, и я не могу выяснить, как пересечь xsd для определенных типов. Пример схемы: <xsd:element называют = "ServerOwner"...
вопрос задан: 30 March 2010 02:49
1
ответ

Ссылки на сущность и lxml

Вот код, который я имею: от импорта cStringIO StringIO от lxml импортируют etree xml = StringIO ('' '<? версия xml = "1.0" кодирование = "UTF-8"?> <! Корень DOCTYPE [<! Тест ОБЪЕКТА "Это - тест">...
вопрос задан: 26 March 2010 15:14
1
ответ

HTML Lxml xpath контекст

Я использую lxml для парсинга файла HTML, и я хотел бы знать, как я могу установить контекст поиска xpath. Что я имею в виду меня, что я имею элемент узла и хочу заставить xpath искать только в этом узле как будто...
вопрос задан: 12 November 2009 20:48
1
ответ

Как я могу просмотреть текстовое представление lxml элемента?

Если я анализирую XML-документ с помощью lxml, действительно ли возможно просмотреть текстовое представление элемента? Я пытался сделать: распечатайте repr (узел), но это производит <Элемент obj в b743c0>, Что может я...
вопрос задан: 14 October 2009 17:48
1
ответ

lxml, эквивалентный BeautifulSoup “ИЛИ” синтаксису?

Я преобразовываю некоторый код парсинга HTML от BeautifulSoup до lxml. Я пытаюсь выяснить lxml эквивалентный синтаксис для следующего оператора BeautifullSoup: soup.find ({'класс': ['текущий...
вопрос задан: 5 September 2009 23:04
1
ответ

Как добавить пространство имен к атрибуту в lxml

Я пытаюсь создать xml запись, которая похожа на этот Python использования и lxml: <ресурс href = "Единица 4.html" adlcp:scormtype = "sco"> я использую Python и lxml. Я испытываю затруднения из-за adlcp:...
вопрос задан: 3 September 2009 16:29
1
ответ

Изменение добавления отступа по умолчанию etree.tostring в lxml

У меня есть XML-документ, который я - довольно печатающее использование lxml.etree.tostring, печатают etree.tostring (документ, pretty_print=True), уровень по умолчанию добавления отступа является 2 пробелами, и я хотел бы изменить это на 4...
вопрос задан: 6 August 2009 13:47
0
ответов

Setup.py: установить lxml с Python2.6 на CentOS

Я установил Python 2.6. 6 в CentOS 5.4, [@ SC-055 lxml-2.3beta1] $ python Python 2.6.6 (r266: 84292, 4 января 2011 г., 09:49:55) [GCC 4.1.2 20080704 (Red Hat 4.1.2-46)] на linux2 Введите "help", "...
вопрос задан: 8 November 2019 09:29
0
ответов

Escape unescaped characters in XML with Python

I need to escape special characters in an invalid XML file which is about 5000 lines long. Here's an example of the XML that I have to deal with: name &...
вопрос задан: 11 August 2019 14:09
0
ответов

Как можно переписать эту функцию для реализации OrderedDict?

У меня есть следующая функция, которая выполняет грубую работу по синтаксическому анализу XML-файла в словарь. К сожалению, поскольку словари Python не упорядочены, я не могу циклически перемещаться по узлам, поскольку я ...
вопрос задан: 17 July 2019 17:53
0
ответов

Каковы различия между lxml и ElementTree?

Когда дело доходит до генерации XML-данных в Python, есть две библиотеки, которые я часто рекомендую: lxml и ElementTree Из того, что я могу сказать, две библиотеки очень похожи друг на друга. Они оба ...
вопрос задан: 4 May 2019 12:57
0
ответов
0
ответов

Разбор HTML с помощью ссылки на сущность

Я пытаюсь проанализировать некоторый HTML-код, в качестве которого приведен пример < solids > & Амп; sub2; & Л; / твердые частицы > HTML-файл читается как строка. Мне нужно вставить HTML из файла, который sub2 определяет в ...
вопрос задан: 19 March 2019 22:00
0
ответов

builtins.TypeError: должен быть str, а не байты

Я преобразовал свои скрипты из Python 2.7 в 3.2, и у меня есть ошибка. # - * - кодирование: utf-8 - * - время импорта из даты и времени, даты импорта из lxml, импорта из коллекций, импорта OrderedDict # Создать ...
вопрос задан: 7 March 2019 01:01