Последние пару дней я потратил на то, чтобы разобраться с основами lxml, в частности, используя lxml.html для анализа веб-сайтов и создания ElementTree содержимого. В идеале я хочу сохранить возвращенное ElementTree так что я могу загрузить его и поэкспериментировать с ним, не разбирая веб-сайт каждый раз, когда я изменяю свой скрипт. Я предполагал, что лучше всего будет маринование, но теперь начинаю задаваться вопросом. Хотя я могу получить объект ElementTree после травления ...
type(myObject)
возвращает
<class 'lxml.etree._ElementTree'>
, сам объект кажется «пустым», поскольку ни один из последующих вызовов метода / атрибута, которые я выполняю для него, не дает никаких результатов.
Я предполагаю, что травление здесь неприемлемо, но может ли кто-нибудь предложить альтернативу?
(В случае необходимости, описанное выше происходит в: python3.2, lxml 2.3.2, snow-leopard))