0
ответов

Как обрабатывать Element.tail в lxml / elementtree .iter ()

Думая о том, как работает следующая проблема с итерацией дерева, завязались у меня в голове узлы, которые, возможно, некоторые из вас помогут решить / развязать. У меня есть (TEI) XML-тексты, и я хочу сегментировать их по < milestone > s ....
вопрос задан: 24 February 2019 10:29
0
ответов

Как красиво распечатать HTML в файл, с отступом

Я использую lxml.html для генерации некоторых HTML. Я хочу красиво распечатать (с отступом) мой конечный результат в html файл. Как это сделать? Это то, что я пробовал до сих пор (я относительно ...
вопрос задан: 29 December 2018 06:52
0
ответов

Превратите элемент lxml.objectify обратно в XML.

Я использую lxml.objectify, чтобы легко анализировать XML-файл и работать с ним. По причинам аудита я должен сохранить производный объект вместе с исходным XML-кодом элемента. root = lxml.objectify ....
вопрос задан: 2 August 2018 01:01
0
ответов

Загрузка образа Python с lxml

Мне нужно найти изображение в HTML-коде, подобное этому :... Пример ... Я использую...
вопрос задан: 5 April 2018 16:11
0
ответов

lxml.etree, element.text не t вернуть весь текст из элемента

Я удалил некоторый html через xpath, который затем преобразовал в etree. Что-то похожее на это: text1 ссылка text2 , но когда я вызываю element.text, я только ...
вопрос задан: 16 October 2017 11:37
0
ответов

Как сохранить объект etree xml? сохранение загрузки объектов etree lxml проблема

У меня есть объект etree с именем projectxml: projetxml type Мне нужно сохранить его на диске, поэтому я конвертирую его в дерево элементов: savexml=et.ElementTree (проектxml) savexml....
вопрос задан: 2 August 2017 14:37
0
ответов

ошибка пипса: нераспознанный параметр командной строки «-fstack-protector-strong»

Когда я запускаю sudo pip pyquery, sudo pip install lxml и sudo pip install cython, я получаю очень похожий вывод с той же ошибкой, которая говорит: x86_64-linux-gnu-gcc: error: нераспознанная командная строка ...
вопрос задан: 23 May 2017 21:47
0
ответов

Как разбирать этот огромный XML-файл с вложенными элементами, используя LXML эффективным способом?

Я пытался распределить этот огромный XML-документ Использование XML MiniDom. Хотя он отлично работал в файле образца, он выдохнул систему при попытке обработки реального файла (около 400 МБ). Я попробовал адаптацию кода (... [
вопрос задан: 23 May 2017 12:32
0
ответов

Python Lxml (objectify): Проверка наличия тега

Мне нужно проверить, существует ли определенный тег в файле xml. Например, я хочу увидеть, существует ли тег в этом фрагменте:
Привет ...
вопрос задан: 23 May 2017 12:13
0
ответов

разбор большого xml-файла с помощью Python -ошибка etree.parse

Попытка проанализировать следующий файл Python с помощью функции lxml.etree.iterparse. "sampleoutput.xml" Элемент 1 Описание 1
вопрос задан: 23 May 2017 12:03
0
ответов

Фильтрация определенных байтов в python

Я получаю эту ошибку в моей программе на Python: ValueError: все строки должны быть совместимы с XML: Unicode или ASCII, без байтов NULL или управляющие символы Этот вопрос, случайный текст из / dev / random Повышение ...
вопрос задан: 23 May 2017 11:54
0
ответов

Удаление атрибутов пространства имен python из lxml.objectify.ObjectifiedElement [duplicate]

Возможный дубликат: при использовании lxml можно ли отобразить XML без атрибутов пространства имен? Как я могу удалить атрибуты python из lxml.objectify.ObjectifiedElement? Пример: В [1]: from ...
вопрос задан: 23 May 2017 11:46
0
ответов

Декодировать строку base64 в python 3 (с помощью lxml или нет)

Я знаю, что это выглядит до безобразия просто, и я предполагаю, что проблема в том, что у меня просто нет четкого понимания всего этого bytes-str-unicode ( а кодирование-декодирование, говоря откровенно) еще мелочи. Я...
вопрос задан: 23 May 2017 10:28
0
ответов

(все еще) не может правильно установить lxml 2.3 для python, но как минимум 2.2.8 работает

30 июня 2011 г. - награждаю @Pablo за этот вопрос из-за его ответа. Я до сих пор не могу правильно установить lxml 2.3 по причинам, описанным в его комментариях. Я собираюсь немного поработать ...
вопрос задан: 23 May 2017 10:28
0
ответов

Извлечение lxml xpath для таблицы html

У меня есть html-документ, подобный следующему: < ...
вопрос задан: 16 March 2017 14:03
0
ответов

Лучшее Практика хранения учетных данных для междоменного доступа к веб-службам?

Я работаю над приложением, которое будет подключаться к различным удаленным серверам с помощью веб-службы для получения некоторой информации о состоянии этих (Windows) компьютеров. Он хорошо работает в рамках одного ...
вопрос задан: 14 December 2016 08:00
0
ответов

Python lxml / beautiful soup для поиска всех ссылок на веб-странице

Я пишу сценарий для чтения веб-страницы и создаю базу данных ссылок, которая соответствует определенным критериям. Прямо сейчас я застрял с lxml и понимаю, как получить все из ...
вопрос задан: 1 December 2016 23:50
0
ответов

Симпатичный XML-принтер Python с lxml

После чтения из существующего файла с «некрасивым» XML и внесения некоторых изменений, красивая печать не работает. Я пробовал etree.write (FILE_NAME, pretty_print = True). У меня есть следующий XML: <...
вопрос задан: 20 October 2016 17:51
0
ответов

lxml etree xmlparser удалить нежелательное пространство имен

У меня есть xml-документ, который я пытаюсь проанализировать с помощью Etree.lxml
1
вопрос задан: 3 September 2016 05:22
0
ответов

Как узнать количество элементов в дереве элементов в Python?

Я новичок в дереве элементов, здесь я пытаюсь найти количество элементов в дереве элементов. из lxml import etree root = etree.parse (open ("file.xml", 'r')) есть ли способ найти общее ...
вопрос задан: 1 July 2016 17:00
0
ответов

Лучший способ для новичка изучить очистку экрана с помощью Python

Это может быть один из тех вопросов, которые трудно решить ответ, но здесь: я не считаю себя программистом - но я бы хотел :-) Я выучил R, потому что мне надоел spss, ...
вопрос задан: 5 April 2016 07:07
0
ответов

Python, lxml и удаление внешнего тега из использования lxml.html.tostring (el)

Я использую нижеприведенное, чтобы получить все HTML-содержимое раздела для сохранения в база данных el = doc.get_element_by_id ('productDescription') lxml.html.tostring (el) В описании продукта есть тег, который ...
вопрос задан: 24 March 2016 22:05
0
ответов

Получить весь текст внутри тега в lxml

Я хотел бы написать фрагмент кода, который будет захватывать весь текст внутри тега в lxml во всех трех нижеприведенных случаях, включая теги кода. Я пробовал tostring (getchildren ()), но ...
вопрос задан: 13 January 2016 20:17
0
ответов

Использование Python Iterparse для больших файлов XML

Мне нужно напишите парсер на Python, который может обрабатывать некоторые очень большие файлы (> 2 ГБ) на компьютере без большой памяти (всего 2 ГБ). Я хотел использовать iterparse в lxml для этого. Мой файл ...
вопрос задан: 19 November 2015 22:14
0
ответов

Как найти XML-элементы через XPath в Python без привязки к пространству имен?

Так как эта неприятная проблема возникла у меня второй раз, я подумал, что вопрос поможет. Иногда мне нужно получить элементы из XML-документов, но способы сделать это неудобны. Я хотел бы знать ...
вопрос задан: 8 October 2015 09:54
0
ответов

ImportError on Google App Engine with lxml

Я использую lxml для разбора страниц. Когда я запускаю свой код с app engine sdk, он работает, но когда я развертываю свое приложение в облаке, я получаю сообщение здесь: Traceback (последний последний вызов): File "/...
вопрос задан: 17 April 2015 08:40
0
ответов

lxml конвертирует элемент в elementtree

Следующий тест читает файл и с помощью lxml.html генерирует конечные узлы DOM / Graph для страницы. Однако я также пытаюсь понять, как получить ввод из «строки». Использование lxml ....
вопрос задан: 17 February 2015 15:57
0
ответов

Python lxml E-Factory

Я использовал lxml «E-Factory» (также известный как ElementMaker) для создания XML-документов. Я пытаюсь создать xml-документ, похожий на этот: 11-11-11
вопрос задан: 10 February 2015 22:47
0
ответов

Создание lxml для Python 2.7 в Windows

Я пытаюсь создать lxml для Python 2.7 на машине Windows 64 битов. Я не мог найти lxml яйцо для версии Python 2.7. Таким образом, я компилирую его из источников. Я следую инструкциям на этом сайте http://...
вопрос задан: 14 November 2014 04:48
0
ответов

Рекомендуемый способ создания документов XHTML с помощью lxml

Библиотека Python lxml предоставляет несколько компоновщиков для создания HTML-документов. В чем разница между ними? Но они генерируют простой HTML, а не XHTML. Хотя я мог бы...
вопрос задан: 13 November 2014 07:25