0
ответов

Как разбирать этот огромный XML-файл с вложенными элементами, используя LXML эффективным способом?

Я пытался распределить этот огромный XML-документ Использование XML MiniDom. Хотя он отлично работал в файле образца, он выдохнул систему при попытке обработки реального файла (около 400 МБ). Я попробовал адаптацию кода (... [
вопрос задан: 23 May 2017 12:32
0
ответов

Разбор огромных плохо закодированных файлов XML в Python

Я работаю над кодом, который анализирует внешние файлы XML -. Некоторые из этих файлов огромны, до гигабайт данных. Излишне говорить, что эти файлы нужно анализировать как поток, потому что загрузка их в...
вопрос задан: 23 May 2017 11:54
0
ответов

lxml ошибка etree.iterparse «TypeError :чтение файловых объектов должно возвращать простые строки»

Я хотел бы проанализировать HTML-документ, используя lxml. Я использую python 3.2.3 и lxml 2.3.4(http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml)Я использую etree.iterparse для разбора документа, но...
вопрос задан: 20 April 2012 07:51
0
ответов

использование lxml и iterparse() для разбора большого (+- 1 Гб) XML-файла

Мне нужно проанализировать XML-файл размером 1 Гб со структурой, подобной приведенной ниже, и извлечь текст внутри тегов «Автор» и «Контент». ": MM/DD/YY
вопрос задан: 24 March 2012 22:25
0
ответов

lxml iterparse в python не может обрабатывать пространства имен

из lxml import etree import StringIO data = StringIO.StringIO (' Один Два Три < / корень> ') docs = ...
вопрос задан: 10 August 2011 21:53