scrapy - список вопросов по программированию scrapy

1

ответ

Xpath верный, но паук Scrapy не работает

Я пытаюсь скачать с веб-страницы, я идентифицирую выражение XPath и затем запускаю паука, но ничего не загружается. Веб-страница: https://octopart.com/electronic-parts/integrated-circuits-ics ...

xpath scrapy

вопрос задан: 3 March 2019 16:49

1

ответ

Не могу присвоить значение самопеременной python

Я пытаюсь добавить строку в массив indexes внутри функции разбора, но когда я пытаюсь сохранить ее в .json, он становится пустым. import scrapy import json class NewsBrief (scrapy.Spider): имя = "трусы" ...

python scrapy

вопрос задан: 26 February 2019 12:32

1

ответ

Данные таблицы с дополнительными элементами пользователя в CSV с использованием Scrapy

У меня есть скрипт, использующий scrapy, который берет данные из таблицы. Но он сохраняется в формате, потому что исходные данные в порядке аргументов строки: имя firstitem seconditem ... lastitem Как я могу ...

python date dictionary scrapy export-to-csv

вопрос задан: 23 February 2019 15:14

1

ответ

Scrapy Result не пишется

Я перебираю следующий сайт: https://graphics.stltoday.com/apps/payrolls/salaries/teachers/ Надеюсь почистить все данные для каждого человека. Это означает, что перейдя по ссылке на каждый район, затем ...

scrapy scrapy-spider

вопрос задан: 20 January 2019 05:19

1

ответ

Паук-скраб с IMAGES_STORE в DigitalOcean Spaces

Мне нужна помощь с настройкой IMAGES_STORE для моего паука-скрапа. Я хостинг с DigitalOcean и хотел бы загрузить изображения в их пространства. Мое приложение для скрапбукинга интегрировано с Django ...

amazon-web-services python scrapy digital-ocean

вопрос задан: 17 January 2019 11:10

1

ответ

Запуск пользовательского кода после завершения сканирования (scrapy)

Мне нужно проверить все мои очищенные данные после завершения сканирования (процент доступности некоторых полей и т. Д.). Данные содержатся в CSV-файле, поэтому для тестирования я решил использовать Pandas. Есть ...

python scrapy

вопрос задан: 17 January 2019 10:22

1

ответ

JSONDecodeError: Ожидаемое значение в scrapy

Я использую scrapy json.load (response.body), и мы нашли JSONDecodeError: Ожидаемое значение: строка 1, столбец 1 (символ 0). Вот ссылка https: //www.magellanprovider.com/ProviderSearchGateway/sessions / ...

scrapy json

вопрос задан: 16 January 2019 10:14

1

ответ

Scrapy не возвращает результаты для определенных тегов

Я только начал использовать Scrapy сегодня, но у меня есть опыт программирования на javascript, поэтому, пожалуйста, потерпите меня, я дам очень подробное объяснение: я использую GramReport для анализа некоторых ...

python xpath web-scraping scrapy web-crawler

вопрос задан: 16 January 2019 06:03

1

ответ

Scrapy: как передавать ссылки

Я не могу передавать ссылки. При запуске паука я не получаю данные с кодом. Я новичок в Scrapy import scrapy от movie.items импортирует класс AfishaCinema AfishaCinemaSpider (scrapy ....

python-3.x web-scraping scrapy

вопрос задан: 13 July 2018 08:30

1

ответ

Как использовать запрос Scrapy и получить ответ в одном месте?

Я пишу сканирующий гусеничный аппарат для очистки данных с веб-сайта электронной коммерции. На сайте есть вариант цвета, и каждый вариант имеет собственную цену, размеры и запас для этих размеров. Чтобы получить цену, ...

python callback scrapy

вопрос задан: 13 July 2018 05:34

1

ответ

scrapy: как спать паука, пока нет запроса [дубликат]

Я использую scrapy-redis, и я меняю код: def next_request (self): block_pop_timeout = self.idle_before_close request = self.queue.pop (block_pop_timeout) while (not request): time ....

scrapy

вопрос задан: 13 February 2017 17:53

1

ответ

Получите документ DOCTYPE с BeautifulSoup

Я только что начал переделывать пестрый в сочетании с BeautifulSoup, и я задаюсь вопросом, пропускаю ли я что-то очень очевидное, но я, может казаться, не выясняю, как получить doctype возвращенного...

python parsing beautifulsoup scrapy

вопрос задан: 20 December 2016 01:56

1

ответ

Python Scrapy, как определить конвейер для объекта?

Я использую пестрый для проверки различных сайтов для каждого сайта, у меня есть Объект (другая информация извлечена) ну, например, у меня есть универсальный конвейер (большей частью информации является то же), но теперь я...

python screen-scraping scrapy

вопрос задан: 2 November 2015 16:10

1

ответ

Scrapy, как определить пользовательские ItemExporters [duplicate]

Я хочу экспортировать скребковые данные в листы Google. Я знаю, что я могу написать собственный конвейер для получения информации о необходимости экспорта, но из протоколов пробной документации они не предназначены для использования таким образом. Они п

python python-3.x scrapy

вопрос задан: 22 October 2015 21:15

1

ответ

ImportError: нет ни одного модуля с именем win32api при использовании Scrapy

Я новый ученик Scrapy. Я установил Python 2.7 и все остальные движки, необходимые. Затем я попытался создать проект Scrapy, следуя инструкциям http://doc.scrapy.org/en/latest/intro/tutorial.html. ...

scrapy-spider scrapy python

вопрос задан: 15 September 2015 13:03

1

ответ

Как установить настраиваемые переменные аргументов в bash? [Дубликат]

Я пытаюсь запланировать задание cron с использованием сценария bash, который вызывает команду scraw crawl. Для одного из аргументов scrapy у меня есть аргумент, называемый запросом, который является дат-временем, которое я хочу начать ...

bash scrapy

вопрос задан: 13 June 2013 19:09

1

ответ

У кого-либо есть пример кода для конвейера sqlite в Scrapy?

Я ищу некоторый пример кода конвейера SQLite в Scrapy. Я знаю, что существует не создано в поддержке его, но я уверен, что это было сделано. Только фактический код может помочь мне, поскольку я только знаю достаточно Python...

python sqlite export scrapy

вопрос задан: 20 July 2010 21:16

1

ответ

Как создать поисковый робот на основе Scrapy для выполнения навсегда?

Я хочу создать поисковый робот на основе Scrapy для захвата изображений новостей от нескольких веб-сайтов портала новостей. Я хочу к этому поисковому роботу быть: Выполненный навсегда Средства это будет периодический пересматривать некоторые страницы порт

python web-crawler scrapy

вопрос задан: 28 February 2010 04:07

1

ответ

Scrapy SgmlLinkExtractor игнорирует позволенные ссылки

Смотрите на этот пример паука в документации Scrapy. Объяснение: Этот паук запустил бы домашнюю страницу example.com сканирования, собрав ссылки категории и ссылки на элемент, анализируя...

python web-crawler scrapy

вопрос задан: 28 November 2009 00:34

1

ответ

Scrapy BaseSpider:Как это работает?

Это - пример BaseSpider из учебного руководства Scrapy: от импорта scrapy.spider BaseSpider от scrapy.selector импортируют HtmlXPathSelector из импорта dmoz.items класс DmozItem DmozSpider (...

python web-crawler scrapy

вопрос задан: 27 November 2009 00:15

0

ответов

Доступ к моделям django внутри Scrapy

Можно ли получить доступ к моим моделям django внутри конвейера Scrapy, чтобы я мог сохранить полученные данные прямо в моей модели? Я видел это, но не знаю Не знаете, как это настроить?

python django django-models scrapy

вопрос задан: 27 June 2019 14:23

0

ответов

Как мне объединить результаты с целевой страницы на текущую в scrapy?

Нужен пример в scrapy о том, как получить ссылку с одной страницы, затем перейдите по этой ссылке, получите дополнительная информация со связанной страницы и объединение с некоторыми данными с первой страницы.

python web-scraping scrapy

вопрос задан: 26 June 2019 19:17

0

ответов

Как динамически генерировать start_urls при сканировании?

Я просматриваю сайт, который может содержать много start_urls, например: http: // www .a.com / list_1_2_3.htm Я хочу заполнить начальные_урлы, например [list_ \ d + _ \ d + _ \ d + \. htm], и извлекаю элементы из URL-адресов, например [node _ \ ...

web-scraping scrapy web-crawler

вопрос задан: 24 June 2019 09:56

0

ответов

как передать аргумент в паука-скрапа и инициировать его из питона

я пытаюсь передать переменную screen_name моему пауку, потому что это screen_name будет меняться каждый раз. (конечная цель - запустить несколько пауков с разными именами экранов) я инициализирую ...

python python-3.x scrapy

вопрос задан: 19 May 2019 13:06

0

ответов

Мой обход паука через SplashRequest вызвал неожиданную остановку всплеска через некоторое время выполнения

Я использую SplashRequest, чтобы выполнить некоторый код JavaScript через скрипт Lua. Если я запускаю короткий список URL-адресов, все работает нормально, но проблема возникает, когда в списке более ~ 50 URL-адресов, это вызвало ...

python scrapy scrapy-splash

вопрос задан: 28 March 2019 03:12

0

ответов

Дублированные результаты показаны структурой последовательности в Python

Идея состоит в том, чтобы удалить имена и количество элементов с главной страницы и удалить рейтинг со страницы ссылок, но результат показывает несколько повторяющихся результатов.

python scrapy

вопрос задан: 24 March 2019 07:34

0

ответов

Паук Scrapy только возвращает последний пункт в списке

Я строю скребок для сканирования страницы и возврата нескольких элементов (тегов h3 & amp; p) из div По какой-то причине, скребок будет печатать все поля имени при вызове, но сохраняет информацию только для ...

web-scraping scrapy web-crawler

вопрос задан: 24 March 2019 06:04

0

ответов

невозможно развернуть scrapy на сервере scrapyd

Я пытаюсь развернуть мой scrap, который подключен к проекту django, к scrapyd, но когда я попробовал scrapyd-deploy JD -p JDSpider, это не удалось. Он сказал, что нет модуля с именем GradutionProject. Кажется, скрапид ...

scrapy django-settings scrapyd scrapy-settings

вопрос задан: 23 March 2019 17:20

0

ответов

Python Scrapy Многостраничный скребок

Я пытаюсь добавить +1 к URL-адресу и очистить несколько страниц, но получаю сообщение об ошибке + x scrap import import # здесь отформатирован класс HeadphonesSpider (scrapy.Spider): name = "наушники" def ...

python scrapy

вопрос задан: 22 March 2019 12:48

0

ответов

Используйте ImagesPipeline во вложенных элементах в Scrapy

У меня есть пустые массивы, когда я пытаюсь загрузить изображения в scrapy, и это кажется немного странным. Я следовал за шагами, но кажется, что ImagePipeline не работает с вложенными элементами. Но это важно ...

python scrapy

вопрос задан: 21 March 2019 15:28