web-scraping - список вопросов по программированию web-scraping

3

ответа

Извлечение текстов, содержащихся в теге html, с символом авторского права © с использованием Python 3

Мне нужно проверить, имеет ли веб-страница символ авторского права ©, и если да, я извлекаю тексты тега, содержащего символ. Например, для веб-страницы «profile.theguardian.com/signin» целевые тексты ...

вопрос задан: 13 July 2018 20:44

3

ответа

Скребки и петли мета-теги с красивым супом

Ниже находится веб-скребок, который использует красивый суп, чтобы очистить список команд с этого веб-сайта. Каждый столбец данных помещается в массив, где он затем перебирается в CSV-файл. Я бы хотел ...

python arrays web-scraping beautifulsoup meta-tags

вопрос задан: 13 July 2018 06:26

3

ответа

Как Вы очищаете страницы AJAX?

Советуйте, как очистить страницы AJAX.

web-scraping ajax

вопрос задан: 11 April 2018 07:35

3

ответа

Как программно войти на сайт к screenscape?

Мне нужна некоторая информация с веб-сайта, это не является моим для получения этой информации, в которую я должен войти к веб-сайту для сбора информации, это происходит через HTML-форму. Как я могу сделать это...

c# forms login web-scraping

вопрос задан: 11 August 2017 13:37

3

ответа

Скремблирование таблиц html в фреймы данных R с использованием пакета XML

Как я могу очистить таблицы HTML, используя пакет XML? Взять, к примеру, эту страницу википедии о бразильской футбольной команде. Я хотел бы прочитать это в R и получить "список всех матчей, которые Бразилия имеет ...

web-scraping parsing xml r html

вопрос задан: 10 November 2016 15:40

3

ответа

Я могу распечатать результат, но он не появляется в моем CSV-файле после скремблирования [duplicate]

Я начинаю писать на python и выскабливать, поэтому у меня все еще есть некоторые трудности, чтобы очистить простую таблицу, которая размещена на этом веб-сайте [http: //www.concursopublico.sp.gov.br/PortalConcurso/noauth / ...

python web-scraping beautifulsoup

вопрос задан: 31 December 2014 22:52

3

ответа

Какой Синтаксический анализатор HTML является лучшим? [закрытый]

Я кодирую много синтаксических анализаторов. Вплоть до сих пор я использовал HtmlUnit бездисплейный браузер для автоматизации браузера и парсинга. Теперь, я хочу разделить обоих задачи. Поскольку 80% моей работы включают просто парсинг, меня...

java html parsing html-parsing web-scraping

вопрос задан: 22 May 2014 07:17

3

ответа

Сброс после входа на веб-страницу через Python [дубликат]

Я рассмотрел другие вопросы, которые имеют подобную проблему, но никто из них не работает для меня. Я работаю над Python 3. Я пытался получить контактную информацию и электронный идентификатор колледжа ...

python-3.x login web-scraping screen-scraping

вопрос задан: 18 November 2013 07:43

3

ответа

Python Получить динамическую веб-страницу Содержание [дубликат]

Я использую Python и BeautifulSoup, чтобы сделать некоторые веб-слома. Но для конкретного веб-сайта: http://www.onthehouse.com.au/property_report/vic/craigieburn_3064/milburn_place?streetNumber=14 Я ...

python python-3.x web-scraping beautifulsoup

вопрос задан: 19 December 2012 22:23

3

ответа

Как я могу использовать R (пакеты Rcurl/XML?!) для очистки этой веб-страницы?

У меня есть (несколько сложная) веб-проблема очистки, которую я хочу выполнить и любил бы в некоторое направление (к любому уровню, который Вы испытываете желание совместно использовать), здесь идет: Я хотел бы пройти весь "...

r web-scraping

вопрос задан: 22 October 2012 21:05

3

ответа

Проблемы с веб-хостингом при использовании моего perl-скрипта. Нужна помощь в выборе языка для замены perl [закрыто]

У меня есть веб-сайт, который я делаю, и я собирался внедрить в него скрипт на Perl. Этот скрипт переходит на другую страницу, получает файл .csv, читает строки и разбирает то, что мне нужно. Проблема, которую я ...

web-scraping asp-classic perl

вопрос задан: 29 November 2011 18:31

3

ответа

Очистить и преобразовать веб-сайт в HTML?

Я не сделал этого за 3 или 4 года, но клиент хочет понизить их динамический веб-сайт в статический HTML. Есть ли любые бесплатные инструменты там, чтобы проверить домен и генерировать рабочие файлы HTML к...

html screen-scraping web-scraping

вопрос задан: 12 August 2010 15:30

2

ответа

Как найти тег с определенным текстом с помощью Beautiful Soup?

У меня есть следующий html (разрывы строк отмечены \ n): ... \ n "Некоторый текст:" \ n
\ n некоторое значение \ n ...

python html web-scraping beautifulsoup

вопрос задан: 10 July 2019 04:53

2

ответа

Невозможно вернуть строку и список из одной функции в другую

Я создал скрипт на python для анализа адреса веб-сайтов различных агентств с его целевой страницы и адреса расположения с его внутренней страницы. То, что я не могу понять, как я могу вернуть ...

python python-3.x web-scraping

вопрос задан: 27 March 2019 11:16

2

ответа

Чтение многочисленных таблиц HTML в R

Я пытаюсь собрать таблицы данных html в один фрейм данных и ищу элегантное решение. Есть 255 таблиц, и URL-адреса варьируются в зависимости от двух переменных: год и район Aldermanic. Я знаю ...

r web-scraping xml-parsing

вопрос задан: 24 March 2019 06:54

2

ответа

Scrapy не распознает xpath

Я пытаюсь получить данные с этой страницы https://octopart.com/electronic-parts/integrated-circuits-ics, но с помощью кнопки Specs. Я пытаюсь получить названия продуктов с этим кодом, но это не работает. ...

python xpath web-scraping scrapy

вопрос задан: 21 March 2019 19:39

2

ответа

Выскабливание с просьбами

что не так в моем коде, я пытаюсь получить такой же контент, как в https://koleo.pl/rozklad-pkp/krakow-glowny/radom/19-03-2019_10:00/all/EIP-IC--EIC- EIP-IC-KM-REG, но результат разный, как я хочу. ...

python web-scraping

вопрос задан: 19 March 2019 11:00

2

ответа

Python селен скребок отлично работает на окнах, но не на распианец распбиан

Цель этого сценария - вычеркнуть информацию из моего рабочего графика. Полный скрипт прекрасно работает, когда я запускаю его на своем ноутбуке с Windows, но когда я пытаюсь запустить его на Rasian, появляется щелчок. () На "...

python selenium web-scraping raspberry-pi3 raspbian

вопрос задан: 19 March 2019 00:28

2

ответа

Невозможно получить текст span, используя Python

У меня есть поставщик с веб-страницей для входа, на которой я пытаюсь узнать цену и доступность. В то время как в VBA селекторы работают в Python, я получаю None. Это часть HTML, из которой я получаю цену: ...

python python-3.x web-scraping

вопрос задан: 18 March 2019 13:15

2

ответа

Подождите, пока страница загрузится, прежде чем очищать

Я пытаюсь пересечь несколько страниц футбольного сайта. Все ссылки находятся в списке teamLinks. Пример одной из ссылок: «http://www.premierleague.com//clubs/1/Arsenal/squad?se=79». Я ...

python web-scraping beautifulsoup

вопрос задан: 17 March 2019 19:12

2

ответа

Json Парсинг из API с Dicts

Я пишу кусок кода, чтобы получить определенную информацию из API Лиги Легенд. У меня все работает нормально и печатаю на консоли, мне даже удалось получить доступ к данным и ...

json python-3.x api web-scraping python-requests

вопрос задан: 10 March 2019 07:52

2

ответа

Получил пустой список с красивым супом и селеном

https://www.rottentomatoes.com/m/the_lord_of_the_rings_the_return_of_the_king Я хочу получить ТОМАТОМЕТР и АУДИТОРСКИЙ СЧЕТ с этого сайта, но получил пустой список. суп = BeautifulSoup (HTML, HTML ...

python selenium web-scraping beautifulsoup screen-scraping

вопрос задан: 8 March 2019 08:12

2

ответа

Как нажать на несколько & ldquo; + & rdquo; кнопки на странице в хронологическом порядке и извлекать данные из них с помощью Python?

Мне нужно извлечь номер телефона и ссылки на веб-сайт вместе с названием и страной университетов с веб-сайта. Веб-сайт https: //www.whed.net/results_institutions.php? Chp2 = Бизнес% ...

python-3.x selenium iframe web-scraping webdriverwait

вопрос задан: 7 March 2019 20:00

2

ответа

Beautifulsoup4 не показывает содержимое таблицы

Я использую Beautifulsoup4 для очистки информации в github. Однако всякий раз, когда я пытаюсь получить данные внутри таблицы, программа просто возвращает табличные теги открытия и закрытия. из bs4 import ...

python web-scraping beautifulsoup

вопрос задан: 5 March 2019 19:26

2

ответа

Получить номера страниц Селена Python

У меня есть список кнопок страницы. Это HTML-код. < ul class = "artdeco-pagination__pages artdeco-pagination__pages - number" < li class = "artdeco-pagination__indicator artdeco -...

python python-2.7 selenium selenium-webdriver web-scraping

вопрос задан: 5 March 2019 18:34

2

ответа

Невозможно очистить данные в читаемом формате в R из Википедии

Я новичок в R. Я пытаюсь почистить данные из Википедии, но o / p не в удобочитаемом формате. Ниже мой код: библиотека ("rvest") библиотека ("xml2") библиотека ("magrittr") библиотека ("tidyverse") wiki_url < -...

r web-scraping

вопрос задан: 4 March 2019 19:45

2

ответа

перебирая выпадающее меню с помощью Selenium и Python

Я пытаюсь просмотреть выпадающее меню по этому адресу: https://www.accuform.com/safety-sign/danger-danger-authorized-personnel-only-MADM006 Так, например, первое выпадающее меню - под ...

python selenium web-scraping

вопрос задан: 28 February 2019 16:06

2

ответа

Проблема с получением второй ссылки, когда первая ссылка содержит определенное ключевое слово рядом с ней

Я создал скрипт на python совместно с selenium, чтобы получить первую ссылку (заполненную duckduckgo.com) любого элемента поиска, если только ключевое слово Ad не находится рядом с этой ссылкой, например, на изображении ...

python python-3.x selenium selenium-webdriver web-scraping

вопрос задан: 25 February 2019 20:25

2

ответа

Как продолжить цикл при очистке веб-страниц?

Я написал простой сценарий, чтобы изучить, как работать с Python. Я выбрал этот URL: https://www.ebay.co.uk/b/Mens-Coats-Jackets/57988/bn_692010 На странице 48 позиций и ...

python python-3.x web-scraping beautifulsoup

вопрос задан: 20 February 2019 21:24

2

ответа

Веб-выскабливание Java

Я не могу найти любую хорошую сеть, очищающую основанный на Java API. Сайт, который я должен очистить, не обеспечивает API также; я хочу выполнить итерации по всем веб-страницам с помощью некоторого pageID и извлечь HTML...

java web-scraping frameworks

вопрос задан: 15 February 2019 08:25