python [lxml] - очистка HTML-тегов

Я использовал

var enviar = document.getElementById("enviar");
enviar.type = "submit"; 

Просто потому, что все остальное не работало.

13
задан sadhu_ 2 June 2010 в 00:28
поделиться

1 ответ

Думаю, вам стоит попробовать Beautiful Soup . Воспользуйтесь советом из этой статьи и удалите элементы HTML следующим образом:

from BeautifulSoup import BeautifulSoup

''.join(BeautifulSoup(page).findAll(text=True))

Где страница - ваша строка HTML.

Если вам потребуются дополнительные пояснения, вы можете ознакомиться с ситуацией «Погружение в Python» по синтаксическому анализу HTML .

5
ответ дан 1 December 2019 в 08:52
поделиться
Другие вопросы по тегам:

Похожие вопросы: