сохраняя 'lxml.etree. _ElementTree '

Последние пару дней я потратил на то, чтобы разобраться с основами lxml, в частности, используя lxml.html для анализа веб-сайтов и создания ElementTree содержимого. В идеале я хочу сохранить возвращенное ElementTree так что я могу загрузить его и поэкспериментировать с ним, не разбирая веб-сайт каждый раз, когда я изменяю свой скрипт. Я предполагал, что лучше всего будет маринование, но теперь начинаю задаваться вопросом. Хотя я могу получить объект ElementTree после травления ...

type(myObject) 

возвращает

<class 'lxml.etree._ElementTree'>

, сам объект кажется «пустым», поскольку ни один из последующих вызовов метода / атрибута, которые я выполняю для него, не дает никаких результатов.

Я предполагаю, что травление здесь неприемлемо, но может ли кто-нибудь предложить альтернативу?

(В случае необходимости, описанное выше происходит в: python3.2, lxml 2.3.2, snow-leopard))

12
задан Paul Patterson 25 November 2011 в 21:37
поделиться