Если вы хотите удалить все теги HTML, самый простой способ, который я нашел, - использовать BeautifulSoup:
from bs4 import BeautifulSoup # Or from BeautifulSoup import BeautifulSoup
def stripHtmlTags(htmlTxt):
if htmlTxt is None:
return None
else:
return ''.join(BeautifulSoup(htmlTxt).findAll(text=True))
Я пробовал код принятого ответа, но получаю «RuntimeError: превышена максимальная глубина рекурсии» , что не произошло с вышеупомянутым блоком кода.