Я использую нижеприведенное, чтобы получить все html-содержимое раздела для сохранения в базе данных
el = doc.get_element_by_id('productDescription')
lxml.html.tostring(el)
В описании продукта есть тег это выглядит так:
<div id='productDescription'>
<THE HTML CODE I WANT>
</div>
Код отлично работает, дает мне весь html-код, но как мне удалить внешний слой, то есть
? ]