Я хотел бы написать фрагмент кода, который будет захватывать весь текст внутри тега <content>
в lxml во всех трех нижеприведенных случаях, включая теги кода. Я пробовал tostring(getchildren())
, но это пропустит текст между тегами. Мне не очень повезло, что я искал в API соответствующую функцию. Не могли бы вы помочь мне?
<!--1-->
<content>
<div>Text inside tag</div>
</content>
#should return "<div>Text inside tag</div>
<!--2-->
<content>
Text with no tag
</content>
#should return "Text with no tag"
<!--3-->
<content>
Text outside tag <div>Text inside tag</div>
</content>
#should return "Text outside tag <div>Text inside tag</div>"