Проверьте, существует ли каталог, иначе сделайте один
[ -d "$DIRECTORY" ] || mkdir $DIRECTORY
использование BeautifulSoup:
from BeautifulSoup import BeautifulSoup
html = "<p><ul><li>Foo"
soup = BeautifulSoup(html)
print soup.prettify()
получает Вас
<p>
<ul>
<li>
Foo
</li>
</ul>
</p>
, Насколько я знаю, Вы не можете управлять помещением < li> </li> наклеивает отдельные строки от Foo.
Опрятное использование:
import tidy
html = "<p><ul><li>Foo"
print tidy.parseString(html, show_body_only=True)
получает Вас
<ul>
<li>Foo</li>
</ul>
, К сожалению, я не знаю ни о каком способе сохранить < p> тег в примере. Опрятный интерпретирует его как пустой абзац, а не открытый, таким образом делая
print tidy.parseString(html, show_body_only=True, drop_empty_paras=False)
выходит как [1 114]
<p></p>
<ul>
<li>Foo</li>
</ul>
В конечном счете, конечно, < p> тег в Вашем примере избыточен, таким образом, Вы могли бы согласиться с потерей его.
Наконец, Опрятный может также сделать расположение с отступом:
print tidy.parseString(html, show_body_only=True, indent=True)
становится
<ul>
<li>Foo
</li>
</ul>
, Все они имеют их взлеты и падения, но надо надеяться один из них достаточно близок.
Выполните его до Опрятный или один из его портированных библиотеки .
Попытка кодировать его вручную и Вы будете хотеть выбить глаза.