0
ответов

Что такое https при использовании lxml?

Я использование lxml для анализа HTML-файлов с заданными URL-адресами. Например: link = 'https://abc.com/def' htmltree = lxml.html.parse (ссылка) Мой код работает хорошо в большинстве случаев, в том числе с http: //. ...
вопрос задан: 24 October 2011 22:24
0
ответов

Есть ли переключатель для игнорирования неопределенных префиксов пространства имен в LXML?

Я разбираю не - совместимый XML-файл (формат Sphinx xmlpipe2) и хотел бы, чтобы анализатор LXML игнорировал тот факт, что существуют неразрешенные префиксы пространства имен. Пример Sphinx XML: & ...
вопрос задан: 21 October 2011 11:23
0
ответов

Как получить родительский элемент моего элемента?

Для пример: test = label.find ('image'). attrib ['url'] Как получить родительский элемент изображения?
вопрос задан: 17 October 2011 15:49
0
ответов

Как написать атрибуты пространства имен с помощью LXML?

Я использую lxml (2.2.8) для создания и записи некоторого XML (в частности, XGMML). Приложение, которое будет читать его, по-видимому, довольно суетно и хочет видеть элемент верхнего уровня с: < graph label = "...
вопрос задан: 9 October 2011 10:56
0
ответов

python lxml добавляет элемент после другого элемента

У меня есть следующая HTML-разметка
здесь что-то идет

некоторое содержимое

вопрос задан: 19 September 2011 17:38
0
ответов

Получение событий установки и удаления пакета

Я пытаюсь определить, когда устанавливается новое приложение, но только если оно запущено. Мне удалось обнаружить установку приложения, сделав BroadcastReceiver и активировав его внутри...
вопрос задан: 19 September 2011 11:46
0
ответов

Разделение HTML-документа с использованием LXML.HTML

У меня есть HTML-документ, содержащий несколько глав текста, где тег H1 является сепаратором главы. Как я могу разделить такой документ в HTML-фрагменты, где каждый фрагмент начинается с тега H1 ...
вопрос задан: 3 September 2011 12:33
0
ответов

lxml: Ошибка загрузки DLL: не удалось найти указанный модуль

У меня Windows Server 2008 R2 x64. Он работает под управлением Python27 x86 + Django 1.3 + apache 2.2 x86 под wsgi. Он работает нормально без lxml. Мы используем soaplib, для которого требуется lxml. Я пробовал установить lxml в ...
вопрос задан: 29 August 2011 09:28
0
ответов

Python: вставка HTML-содержимого в тег с помощью lxml.html

I Я использую библиотеку lxml.html для синтаксического анализа HTML-документа. Я обнаружил определенный тег, который я называю content_tag, и хочу изменить его содержимое (т.е. текст между
и
,) ...
вопрос задан: 11 August 2011 18:29
0
ответов

lxml iterparse в python не может обрабатывать пространства имен

из lxml import etree import StringIO data = StringIO.StringIO (' Один Два Три < / корень> ') docs = ...
вопрос задан: 10 August 2011 21:53
0
ответов

Как указать lxml.etree.tostring (element) не записывать пространства имен в python?

У меня есть огромный xml-файл (1 Gig). Я хочу переместить некоторые элементы (записи) в другой файл с таким же заголовком и спецификациями. Скажем, исходный файл содержит эту запись с тегом <...
вопрос задан: 9 August 2011 23:20
0
ответов

Как использовать xpath из lxml на узлах с нулевым пространством имен?

Как лучше всего справиться с отсутствием пространства имен на некоторых узлах в XML-документ с использованием lxml? Должен ли я сначала изменить все именованные узлы None, чтобы добавить имя "gmd", а затем изменить дерево ...
вопрос задан: 2 August 2011 23:45
0
ответов

Ubuntu 11.04 LXML Import Etree Проблема для пользовательского Python

Ubuntu 11.04 имеет родной Python2.7 Я строю Python2.5 от источника до /usr/local/python2.5/bin, и попробуйте установить lxml для моего пользовательского python2 .5 Установить. Также я использую Virtualenv. Я переключаюсь на мой env с ...
вопрос задан: 24 July 2011 12:55
0
ответов

Как сохранить информацию о пространстве имен при разборе HTML с помощью lxml?

>>> из lxml.etree импортировать HTML, tostring >>> tostring (HTML ('')) ' ' Обратите внимание, как тег превращается из
вопрос задан: 6 July 2011 13:34
0
ответов

איז עס מעגלעך צו אַרייַננעמען אַ ביבליאָטעק ווי לקסמל אָן ינסטאָלינג?

איך דאַרפֿן צו דורכפירן עטלעכע קסמל פּאַרסינג ניצן אַ מאַשין וואָס איך קען נישט האָבן דערלויבעניש צו ינסטאַלירן לייברעריז אין. אַזוי איז עס מעגלעך צו אַרייַננעמען אַ פּיטהאָן ביבליאָטעק ווי לקסמל מיט מיין מקור?
вопрос задан: 1 July 2011 15:30
0
ответов

Есть ли элегантный способ подсчета элементов тегов в XML-файле с помощью lxml в Python?

Я мог бы прочитать содержимое XML-файла в строке и использовать строку операций для достижения этого, но я думаю, что есть более элегантный способ сделать это. Поскольку я не нашел подсказки в docus, я скинул ...
вопрос задан: 26 June 2011 12:19
0
ответов

lxml удаляет пробелы и разрывы строк в

Эта небольшая программа: from lxml.html import tostring, fromstring е = fromstring ('' '
вопрос задан: 24 June 2011 15:45
0
ответов

Python lxml iterfind с пространством имен, но префикс = None

Я хочу выполнить iterfind () для элементов, у которых есть пространство имен, но нет префикса. Я хотел бы вызвать iterfind ([tagname]) или iterfind ([tagname], [namespace dict]) Я не хочу вводить тег как ...
вопрос задан: 24 June 2011 00:14
0
ответов

Использование памяти lxml при разборе огромного xml в python

Я новичок в python. Я пытаюсь разобрать огромный XML-файл в моем модуле Python с помощью lxml. Несмотря на очистку элементов в конце каждого цикла, моя память выскакивает и вылетает из приложения. Я ...
вопрос задан: 21 June 2011 19:05
0
ответов

Предикат XPath с подпутьями с lxml?

Я пытаюсь понять XPath, который был отправлен мне для использования с формами ACORD XML (общий формат в страховании). Они прислали мне XPath (усеченный для краткости): ./PersApplicationInfo/...
вопрос задан: 6 June 2011 16:16
0
ответов

выбор значений атрибутов из lxml

Я хочу использовать выражение xpath для получения значения атрибута. Я ожидал, что следующее сработает из lxml import etree для клиента в etree.parse ('file.xml'). Getroot (). Findall ('BOB'): ...
вопрос задан: 25 May 2011 15:16
0
ответов

Элементы оболочки Python lxml

Мне было интересно, какой самый простой способ обернуть элемент другим элементом, используя lxml и Python, например, если у меня есть фрагмент html:

Классный заголовок

Something Neat<...

вопрос задан: 18 May 2011 00:22
0
ответов

Как установить lxml для python без прав администратора на linux?

Мне просто нужны некоторые пакеты, которых нет на хост-машине (а я и linux ... мы. .. мы мало времени проводили вместе ...). Раньше я их устанавливал как: # из исходников python setup.py ...
вопрос задан: 12 May 2011 10:10
0
ответов

How do I remove html entities (and more) using lxml?

I've got an html file that has some text that looks like this (after running it through lxml.html parse, lxml.html clean, and this is the result of etree.tostring(table, pretty_print=True))
вопрос задан: 3 May 2011 20:01
0
ответов

Python, XPath: Find all links to images

I'm using lxml in Python to parse some HTML and I want to extract all link to images. The way I do it right now is: //a[contains(@href,'.jpg') or contains(@href,'.jpeg') or ... (etc)] There are a ...
вопрос задан: 1 May 2011 21:07
0
ответов

Как заменить ссылки с помощью lxml и iterlinks

Я новичок в lxml и пытаюсь понять, как это сделать переписать ссылки с помощью iterlinks (). импорт lxml.html html = lxml.html.document_fromstring (документ) для элемента, атрибута, ссылки, позиции в html.iterlinks (): ...
вопрос задан: 26 April 2011 10:41
0
ответов

Что означает эта ошибка: недопустимый заголовок ELF

Я получаю ОШИБКУ ИМПОРТА со следующим сообщением об ошибке в режиме отладки Django / usr / local / lib / python2. 6 / dist-packages / lxml-2.3-py2.6-win32.egg / lxml / objectify.pyd: недопустимый заголовок ELF Что это ...
вопрос задан: 19 April 2011 08:56
0
ответов

Равенство элементов Lxml с пространствами имен

Я пытаюсь использовать Lxml для анализа содержимого документа .docx. Я понимаю, что lxml заменяет префиксы пространства имен фактическим пространством имен, однако это действительно затрудняет проверку того, что ...
вопрос задан: 30 March 2011 23:40
0
ответов

Как можно заменить элемент текстом в lxml?

С помощью реализации API ElementTree в lxml легко полностью удалить данный элемент из XML-документа, но я не вижу простой способ последовательной замены элемента некоторым текстом. ...
вопрос задан: 24 March 2011 11:11
0
ответов

Невероятно простые вопросы lxml: получение HTML / строкового содержимого lxml.etree._Element?

Это настолько простой вопрос, что я не могу найти его в документации: - / В следующем: img = house_tree.xpath ('// img [@ id = "mainphoto"]') [0] Как мне получить HTML-код тега ? Я '...
вопрос задан: 22 March 2011 18:20