0
ответов

Веб-просмотр сайта ставок с селеном. Неполный список событий

Я написал программу для получения шансов с сайта «Eurobet.it», используя селен, чтобы открыть страницу, содержащую «ChanceMix». Кажется, это работает, но когда игры проходят в более чем одно свидание ...
вопрос задан: 18 January 2019 21:35
0
ответов

Невозможно подключиться к серверу селена вручную

Я хочу почистить отзывы Google для веб-сайта, используя RSelenium. Я не могу подключиться к удаленному серверу с помощью этого кода: remDr < - remoteDriver (remoteServerAddr = "localhost", port = 4445L, ...
вопрос задан: 18 January 2019 16:27
0
ответов

Зачистка ссылок на другие сайты на защищенном паролем сайте с Rvest

Я пытаюсь очистить список ссылок на нескольких страницах на следующем веб-сайте, который защищен паролем. У меня есть подписка на сайт. https://policinginsight.com/media-monitor/ У меня есть ...
вопрос задан: 17 January 2019 10:10
0
ответов

Как скачать файл с безопасного сайта с WinHTTPRequest.5.1

Я пытаюсь загрузить файлы (PDF-файлы) в режиме без вывода сообщений с веб-сайта с VBA. До сих пор я вхожу без проблем, вводя имя пользователя & amp; Пароль на первом экране, перейдите на страницу отчетов на сайте, ...
вопрос задан: 16 January 2019 22:07
0
ответов

403 Запрещено на запросы.пост через Python, хотя Google Chrome получает ответ

Я очень плохо знаком с веб-скребком. Я пытаюсь получить данные продавцов флипкарт для продукта путем обратного инжиниринга запросов и очистки данных. URL, который я пробую: https: //www.flipkart.com / ...
вопрос задан: 16 January 2019 20:59
0
ответов

Невозможно распечатать данные в цикле с помощью селена

Я пытаюсь извлечь адреса. Текст находится под селектором css class = ng-binding. Когда я запускаю адрес независимо от цикла, я получаю точный результат. Тем не менее, когда я включаю его в ...
вопрос задан: 16 January 2019 07:40
0
ответов

Соскоб флажок с Selenium C #

Это таблица, из которой я хочу извлечь. И Элемент Флажка выглядит следующим образом. Я собирал данные с помощью datagridtable. строка Header = driver.FindElement (By.CssSelector ("# ...
вопрос задан: 16 January 2019 00:33
0
ответов

Веб-скребок Python Selenium замедляется, когда Интернет используется другим приложением

Я создал селеновый веб-скребок (см. Код ниже). Он работает нормально и обычно занимает 4-6 секунд за цикл. Однако, если я использую другой веб-браузер, чтобы сделать что-то еще, скажем, проверьте свою электронную почту, в Интернете ...
вопрос задан: 15 January 2019 21:07
0
ответов

Выход из & ldquo;% & rdquo; при построении итеративного URL в R

Я пытаюсь создать URL-адрес в R, чтобы сделать некоторые веб-очистки. Когда мой URL должен использовать «%», я получаю сообщение об ошибке. Ниже приведен пример того, что пытается сделать одна итерация моего кода. Ниже также ...
вопрос задан: 15 January 2019 19:18
0
ответов

Как сохранить данные каждой страницы в CSV

Я работаю над проектом очистки, где я пытаюсь собрать информацию с 13 страниц. Структура страницы идентична, изменяются только URL-адреса. Я могу очистить каждый ...
вопрос задан: 31 December 2018 15:34
0
ответов

Кукольник: невозможно выбрать элемент после нажатия кнопки

Я удаляю данные из RockAuto, но у меня возникла проблема после нажатия href element.querySelector ('div.nchildren'). Он выбирает элемент, полученный после клика, но следующую строку: let ...
вопрос задан: 30 December 2018 12:17
0
ответов

VBA нажимает на Internet Explorer только с Onlick [закрыто]

Потому что не работает? Помогите мне, пожалуйста! :( HTML-код Dim i As Long Dim IE как объект Dim Doc как объект Dim objElement как объект Dim objCollection как объект Dim buttonCollection как объект Dim ...
вопрос задан: 23 September 2018 20:27
0
ответов

Не может справиться с некоторым сложным выложенным контентом с веб-страницы

Я написал скрипт на Python в сочетании с BeautifulSoup для анализа содержимого с веб-страницы. На целевой странице есть две таблицы. Мне нужно использовать вкладку Результаты из первой таблицы ...
вопрос задан: 7 August 2018 21:32
0
ответов

Веб-скребок в R: проблема с шаблоном & amp; nbsp, неспособная получить желаемый результат

Я пытаюсь извлечь данные таблицы, доступные с веб-сайта, используя R. На веб-сайте присутствует только одна таблица. Ниже мой код, который я пытаюсь использовать для извлечения данных таблицы. thepage = ...
вопрос задан: 13 July 2018 23:06
0
ответов

Необходимо автоматизировать поиск фактической информации

Мне нужно автоматизировать с помощью python / scrapy для поиска веб-сайта factiva, чтобы проверить количество статей, опубликованных в списке компаний, и извлечь только общее количество публикаций. Если я смогу получить резюме ...
вопрос задан: 13 July 2018 15:57
0
ответов

Является ли scrapy основой для выбора социальных сетей?

Я новичок в веб-соскабливании. Мой проект заключается в извлечении и анализе данных из социальных сетей с разных страниц бренда (помимо API). Я в настоящее время запутался, потому что нашел несколько фреймворков, и я не ...
вопрос задан: 13 July 2018 14:24
0
ответов

Скремблирование данных веб-сайтов в структурированных столбцах

Я пытаюсь обрезать несколько данных с использованием селена. Я разбираю его, используя стандартный способ, например, css, xpath, id и т. Д., Но для каждого нового веб-сайта мне нужно написать новый скрипт селена, проверив ...
вопрос задан: 13 July 2018 12:45
0
ответов

Как получить содержимое страницы в обход Cloudflare и reCAPTCHA

Я бы хотел бросить страницу с прокси. Я попадаю на страницу с cfscrapy, и я пропускаю Cloudflare (первый «вызов»), затем страница попросит меня reCAPTCHA узнать, являюсь ли я человеком. Это проблема, я ...
вопрос задан: 13 July 2018 12:09
0
ответов

Почему Python Scrapy возвращает пустой ответ

Я пытаюсь получить список транспортных средств с веб-сайта. Я использую Python и Scrapy. Но в некоторых случаях мой ответ пуст. Это происходит каждый раз, но не в том же месте, а не на одном и том же адресе. ...
вопрос задан: 13 July 2018 08:08
0
ответов

Scrapy shell ничего не возвращает

Я хочу извлечь имена организаций и основные сведения о них с этого сайта. Я использую scrapy для извлечения информации. Я попробовал scrapy shell для извлечения первой названия организации TENCENT HOLDINGS ...
вопрос задан: 13 July 2018 06:41
0
ответов

Нужна помощь, связанная с URL-адресами с красивым супом

Я пытаюсь очистить имена всех компаний, перечисленных на этом сайте. Каждая страница (всего 14) показывает название 80 компаний. Каждый URL-адрес имеет начало = 241 & amp; count = 80 & amp; first = 2009 & amp; last = 2018 at ...
вопрос задан: 13 July 2018 04:03
0
ответов

Парсинг ботом защищённого сайта

Я пытаюсь проанализировать веб-сайт «https://ih.advfn.com/stock-market/NYSE/gen-electric-GE/stock-price» и извлечь его последние сообщения с его форума. Это бот защищен с помощью Cloud-flare. Я ...
вопрос задан: 9 April 2018 19:06
0
ответов

Загрузка образа Python с lxml

Мне нужно найти изображение в HTML-коде, подобное этому :... Пример ... Я использую...
вопрос задан: 5 April 2018 16:11
0
ответов

Как очистить страницу с нумерацией страниц с помощью Python и Selenium

Я пытался удалить таблицу под вкладкой «История цен» с веб-сайта http://merolagani.com/CompanyDetail.aspx?symbol=ADBL. Я использовал Selenium для автоматизации процесса, но не могу ...
вопрос задан: 18 December 2017 16:45
0
ответов

Как вызвать функцию Javascript из Python?

Я работаю над проектом по веб-скрапингу. На одном из сайтов, с которым я работаю, данные поступают из Javascript. В одном из моих предыдущих вопросов было предложено, что я могу напрямую вызывать ...
вопрос задан: 17 October 2017 18:16
0
ответов

Как получить/вычислить количество цитирований и/или индексы цитирования из списка авторов?

У меня есть список авторов. Я хочу автоматически получать/вычислять (в идеале ежегодно) индекс цитирования (h-индекс, m-фактор, g-индекс, индикатор HCP или ...) для каждого автора. Указатель года автора сначала...
вопрос задан: 10 September 2017 02:19
0
ответов

Как я могу узнать возраст кеша Google любого URL-адреса или веб-страницы? [closed]

В моем проекте мне нужно добавить возраст кеша Google в качестве важной информации. Я попытался найти в источниках возраст кеша Google, то есть количество дней с момента последнего повторного индексирования страницы Google ...
вопрос задан: 9 August 2017 03:48
0
ответов

встраивая пауков в мою собственную программу, я не хочу вызывать scrapy из командной строки)

аналогично этому вопросу :stackoverflow :работает -несколько -пауков -в -scrapy Мне интересно, могу ли я запустить весь проект scrapy из другой программы на Python? Скажем так, я хотел...
вопрос задан: 23 May 2017 12:31
0
ответов

Использование HTMLParser в Python 3.2

Я использовал HTML Parser для извлечения данных с веб-сайтов и удаления html-кода при этом. Я знаю о различных модулях, таких как Beautiful Soup, но решил пойти по пути не...
вопрос задан: 23 May 2017 12:18
0
ответов

HtmlUnit и XPath: DOMNode.getByXPath работает только с HtmlPage?

Я пытаюсь разобрать страницу со ссылками к статьям, важное содержание которых выглядит следующим образом:

Исполнительское искусство & ...

вопрос задан: 23 May 2017 12:01