Как я могу использовать BeautifulSoup для нахождения всех ссылок на странице, указывающей на определенный домен?

Как я могу использовать BeautifulSoup для нахождения всех ссылок на странице, указывающей на определенный домен?

5
задан bernie 28 January 2010 в 05:03
поделиться

1 ответ

Используйте Supstranter,

from BeautifulSoup import BeautifulSoup, SoupStrainer
import re

# Find all links
links = SoupStrainer('a')
[tag for tag in BeautifulSoup(doc, parseOnlyThese=links)]

linkstodomain = SoupStrainer('a', href=re.compile('example.com/'))

Редактировать: модифицированный пример из официального документа.

8
ответ дан 14 December 2019 в 04:38
поделиться
Другие вопросы по тегам:

Похожие вопросы: