Мне дали URL-адрес, и я хочу извлечь из него содержимое тега
.
Я использую Python3. Я наткнулся на sgmllib
, но он недоступен для Python3.
Кто-нибудь может помочь мне с этим? Могу ли я использовать для этого HTMLParser
?
Вот что я пробовал:
import urllib.request
f=urllib.request.urlopen("URL")
s=f.read()
from html.parser import HTMLParser
class MyHTMLParser(HTMLParser):
def handle_data(self, data):
print("Encountered some data:", data)
parser = MyHTMLParser()
parser.feed(s)
это дает мне ошибку: TypeError: не могу неявно преобразовать объект 'bytes' в str