Я пытаюсь проанализировать содержимое в электронной таблице OpenOffice ODS . Формат ods - это, по сути, просто zip-файл с рядом документов. Содержимое электронной таблицы хранится в файле content.xml. ...
Я хочу проанализировать HTML с lxml, использующим выражения XPath. Моя проблема соответствует для содержания тега: Например, данный <href = "http://something"> Пример </a> элемент я могу...
Я пытаюсь указать пространство имен с помощью lxml подобный этому примеру (взятый отсюда): <TreeInventory xsi:noNamespaceSchemaLocation = "Trees.xsd" xmlns:xsi = "http://www.w3.org/2001/XMLSchema-...
У меня есть этот запрос xpath:/html/body//tbody/tr [*]/td [*]/a [@title] / @href Это извлекает все ссылки с атрибутом заголовка - и дает href в дополнении средства проверки FireFox Xpath. Однако я не могу...
У меня возникают трудности при установке lxml с easy_install в Ubuntu 11. Когда я набираю $ easy_install lxml, я получаю: Поиск lxml Чтение http://pypi.python.org/simple/lxml/ Чтение http: // codespeak ....
я установил lxml2.2.2 на платформе окон (я m использование версии 2.6.5 Python).i, попробовал эту простую команду: из lxml.html импорт анализирует p = синтаксический анализ (‘http://www.google.com’) .getroot (), но я добираюсь...
I need help parsing out some text from a page with lxml. I tried beautifulsoup and the html of the page I am parsing is so broken, it wouldn't work. So I have moved on to lxml, but the docs are a ...
Я работаю над сценарием, использующим lxml.html для синтаксического анализа веб-страниц. В свое время я сделал немало BeautifulSoup, но теперь экспериментирую с lxml из-за его скорости. Я хотел бы знать, что больше всего ...
Я пытаюсь разобрать вторичную страницу с формой. Я использую пример исходного кода по этой ссылке: http://blog.ianbicking.org/2007/09/24/lxmlhtml/ В моем тесте я использую этот URL: http://www.infofer.ro/ Как на ...
Моему приложению нужен lxml> = 2.1, но для установки lxml он необходим для установки libxml2-dev libxslt1-dev, в противном случае возникает ошибка при установке lxml, есть ли способ, с помощью которого я могу ...
Таким образом, у меня есть некоторый XML как это: <панель> <нечто> Что-то </нечто> <baz> <нечто> Привет </нечто> <столкновение> Другой </столкновение> <baz> <панель> И я хочу...
Я должен записать XML-файлы с помощью lxml и Python. Однако я не могу выяснить, использовать ли класс, чтобы сделать это или функцию. Точка быть, это - первый раз, когда я разрабатываю надлежащее программное обеспечение...
Я пытаюсь получить список элементов с определенным типом xsd с lxml 2.x, и я не могу выяснить, как пересечь xsd для определенных типов. Пример схемы: <xsd:element называют = "ServerOwner"...
Вот код, который я имею: от импорта cStringIO StringIO от lxml импортируют etree xml = StringIO ('' '<? версия xml = "1.0" кодирование = "UTF-8"?> <! Корень DOCTYPE [<! Тест ОБЪЕКТА "Это - тест">...
Я использую lxml для парсинга файла HTML, и я хотел бы знать, как я могу установить контекст поиска xpath. Что я имею в виду меня, что я имею элемент узла и хочу заставить xpath искать только в этом узле как будто...
Если я анализирую XML-документ с помощью lxml, действительно ли возможно просмотреть текстовое представление элемента? Я пытался сделать: распечатайте repr (узел), но это производит <Элемент obj в b743c0>, Что может я...
Я преобразовываю некоторый код парсинга HTML от BeautifulSoup до lxml. Я пытаюсь выяснить lxml эквивалентный синтаксис для следующего оператора BeautifullSoup: soup.find ({'класс': ['текущий...
Я пытаюсь создать xml запись, которая похожа на этот Python использования и lxml: <ресурс href = "Единица 4.html" adlcp:scormtype = "sco"> я использую Python и lxml. Я испытываю затруднения из-за adlcp:...
У меня есть XML-документ, который я - довольно печатающее использование lxml.etree.tostring, печатают etree.tostring (документ, pretty_print=True), уровень по умолчанию добавления отступа является 2 пробелами, и я хотел бы изменить это на 4...
Я установил Python 2.6. 6 в CentOS 5.4, [@ SC-055 lxml-2.3beta1] $ python
Python 2.6.6 (r266: 84292, 4 января 2011 г., 09:49:55) [GCC 4.1.2 20080704 (Red Hat 4.1.2-46)] на linux2
Введите "help", "...
I need to escape special characters in an invalid XML file which is about 5000 lines long. Here's an example of the XML that I have to deal with: name &...
У меня есть следующая функция, которая выполняет грубую работу по синтаксическому анализу XML-файла в словарь. К сожалению, поскольку словари Python не упорядочены, я не могу циклически перемещаться по узлам, поскольку я ...
Когда дело доходит до генерации XML-данных в Python, есть две библиотеки, которые я часто рекомендую: lxml и ElementTree Из того, что я могу сказать, две библиотеки очень похожи друг на друга. Они оба ...
Я пытаюсь проанализировать некоторый HTML-код, в качестве которого приведен пример < solids > & Амп; sub2; & Л; / твердые частицы > HTML-файл читается как строка. Мне нужно вставить HTML из файла, который sub2 определяет в ...
Я преобразовал свои скрипты из Python 2.7 в 3.2, и у меня есть ошибка. # - * - кодирование: utf-8 - * - время импорта из даты и времени, даты импорта из lxml, импорта из коллекций, импорта OrderedDict # Создать ...