Лучший способ преобразования пользовательского XML-подобного синтаксиса

Используя Python.

Итак, в основном у меня есть синтаксис тегов, подобный XML, но теги не имеют атрибутов. Итак, , но не . Они регулярно закрываются с .

Вот мой вопрос. У меня есть что-то похожее на это:

<al>
1. test
2. test2
 test with new line
3.  test3
<al>
    1. test 4
    <al>
        2. test 5
        3. test 6
        4. test 7
    </al>
</al>
4. test 8
</al>

И я хочу преобразовать это в:

<al>
<li>test</li>
<li> test2</li>
<li> test with new line</li>
<li>  test3
<al>
    <li> test 4 </li>
    <al>
        <li> test 5</li>
        <li> test 6</li>
        <li> test 7</li>
    </al>
    </li>
</al>
</li>
<li> test 8</li>
</al>

На самом деле я ищу не законченное решение, а скорее толчок в правильном направлении. Мне просто интересно, как люди здесь подойдут к проблеме. Только REGEX? написать полный настраиваемый синтаксический анализатор для синтаксиса тега без атрибутов? Взламываете существующие парсеры XML? и т. д.

Заранее благодарим

5
задан Peach Passion 15 July 2011 в 18:54
поделиться