Анализ HTML-тегов с помощью Python

Мне дали URL-адрес, и я хочу извлечь из него содержимое тега . Я использую Python3. Я наткнулся на sgmllib , но он недоступен для Python3.

Кто-нибудь может помочь мне с этим? Могу ли я использовать для этого HTMLParser ?

Вот что я пробовал:

import urllib.request
f=urllib.request.urlopen("URL")
s=f.read()

from html.parser import HTMLParser
class MyHTMLParser(HTMLParser):
    def handle_data(self, data):
        print("Encountered   some data:", data)

parser = MyHTMLParser()
parser.feed(s)

это дает мне ошибку: TypeError: не могу неявно преобразовать объект 'bytes' в str

5
задан RanRag 1 February 2012 в 20:52
поделиться