Есть ли инструмент на чистом Python, чтобы взять некоторый HTML-код и обрезать его как можно ближе к заданной длине, но удостовериться, что полученный фрагмент имеет правильный формат? Например, с учетом этого HTML:
<h1>This is a header</h1>
<p>This is a paragraph</p>
он не будет создавать:
<h1>This is a hea
, но:
<h1>This is a header</h1>
или, по крайней мере:
<h1>This is a hea</h1>
Я не могу найти тот, который работает, хотя я нашел тот, который полагается на pullparser
, который устарел и мертв.