Усечение HTML в Python

Есть ли инструмент на чистом Python, чтобы взять некоторый HTML-код и обрезать его как можно ближе к заданной длине, но удостовериться, что полученный фрагмент имеет правильный формат? Например, с учетом этого HTML:

<h1>This is a header</h1>
<p>This is a paragraph</p>

он не будет создавать:

<h1>This is a hea

, но:

<h1>This is a header</h1>

или, по крайней мере:

<h1>This is a hea</h1>

Я не могу найти тот, который работает, хотя я нашел тот, который полагается на pullparser , который устарел и мертв.

6
задан slacy 8 December 2011 в 17:12
поделиться