Используя Python.
Итак, в основном у меня есть синтаксис тегов, подобный XML, но теги не имеют атрибутов. Итак,
, но не
. Они регулярно закрываются с
.
Вот мой вопрос. У меня есть что-то похожее на это:
<al>
1. test
2. test2
test with new line
3. test3
<al>
1. test 4
<al>
2. test 5
3. test 6
4. test 7
</al>
</al>
4. test 8
</al>
И я хочу преобразовать это в:
<al>
<li>test</li>
<li> test2</li>
<li> test with new line</li>
<li> test3
<al>
<li> test 4 </li>
<al>
<li> test 5</li>
<li> test 6</li>
<li> test 7</li>
</al>
</li>
</al>
</li>
<li> test 8</li>
</al>
На самом деле я ищу не законченное решение, а скорее толчок в правильном направлении. Мне просто интересно, как люди здесь подойдут к проблеме. Только REGEX? написать полный настраиваемый синтаксический анализатор для синтаксиса тега без атрибутов? Взламываете существующие парсеры XML? и т. д.
Заранее благодарим