Я пытаюсь получить все содержимое между открывающим тегом xml и его закрывающим аналогом.
Получить содержимое в простых случаях, таких как заголовок
ниже, легко, но как я могу получить весь контентмежду тегами, если используется смешанный контенти я хочу сохранить внутренние теги?
<?xml version="1.0" encoding="UTF-8"?>
<review>
<title>Some testing stuff</title>
<text sometimes="attribute">Some text with <extradata>data</extradata> in it.
It spans <sometag>multiple lines: <tag>one</tag>, <tag>two</tag>
or more</sometag>.</text>
</review>
Мне нужно содержимое между двумятекстовыми
тегами, включая любые теги: Некоторый текст с
Сейчас я использую регулярные выражения, но это немного запутывает, и мне не нравится такой подход. Я склоняюсь к решению на основе парсера XML. Я просмотрел minidom
, etree
, lxml
и BeautifulSoup
, но не смог найти решения для этого случая (все содержимое, включая внутренние теги).