Scrapy Crawler для рекурсивного разбора данных не может перезвонить

Question

Scrapy Crawler для рекурсивного разбора данных не может перезвонить

Когда я использую docker compose, он отлично выполняет приложение, однако, когда я использую docker run, ничего не происходит
blockquote>
Это кажется ожидаемым, поскольку docker run будет запускать одно изображение . В отличие от docker compose , который будет запускать приложение-доклер multi-container .

Для всех изображений для запуска, начиная с правильного порядка, чтобы все могло случиться.

0

python scrapy

задан Phuong Nguyen Dinh 18 January 2019 в 19:21

2 ответа

Другие вопросы по тегам:

python scrapy

Похожие вопросы:

score 0 · Answer 1

Вместо использования Selenium выясните, какой запрос выполняет веб-сайт с использованием JavaScript (во время навигации перейдите на вкладку «Сеть» инструментов разработчика вашего браузера) и воспроизведите аналогичный запрос.

Веб-сайт использует JSON-запросы для извлечения элементов, которые гораздо проще анализировать, чем HTML.

Кроме того, если вы не знакомы с асинхронной природой Scrapy, вы, вероятно, получите неожиданные проблемы при использовании его в сочетании с Selenium.

Такие решения, как Splash или Selenium, предназначены для использования только в качестве последнего ресурса, когда все остальное терпит неудачу.

score 0 · Answer 2

hxs = HtmlXPathSelector(response)    #response is already in Selector, use direct `response.xpath`

url = urllib.parse.urljoin(response.url, url)

использовать как:

url = response.urljoin (url)

да, он будет остановлен как повторяющийся запрос к prev URL, вам нужно добавить dont_filter=True проверить