Как динамически генерировать start_urls при сканировании?

Question

Как динамически генерировать start_urls при сканировании?

. Я просматриваю сайт, который может содержать много начальных_урлов , например:

http://www.a.com/list_1_2_3.htm

Я хочу заполнить начальные_урлы например [list_ \ d + _ \ d + _ \ d + \. htm] , и извлекать элементы из URL-адресов типа [node_ \ d + \. htm] во время сканирования.

Могу ли я использовать CrawlSpider для реализации этой функции? И как мне динамически сгенерировать start_urls при сканировании?

24

web-scraping scrapy web-crawler

задан daaawx 24 June 2019 в 09:56

0 ответов

Другие вопросы по тегам:

web-scraping scrapy web-crawler

Как динамически генерировать start_urls при сканировании?

0 ответов

Похожие вопросы: