Я пытался распределить этот огромный XML-документ Использование XML MiniDom. Хотя он отлично работал в файле образца, он выдохнул систему при попытке обработки реального файла (около 400 МБ). Я попробовал адаптацию кода (... [
Я работаю над кодом, который анализирует внешние файлы XML -. Некоторые из этих файлов огромны, до гигабайт данных. Излишне говорить, что эти файлы нужно анализировать как поток, потому что загрузка их в...
Я хотел бы проанализировать HTML-документ, используя lxml. Я использую python 3.2.3 и lxml 2.3.4(http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml)Я использую etree.iterparse для разбора документа, но...
Мне нужно проанализировать XML-файл размером 1 Гб со структурой, подобной приведенной ниже, и извлечь текст внутри тегов «Автор» и «Контент». ": MM/DD/YY