3
ответа

Извлечение текстов, содержащихся в теге html, с символом авторского права © с использованием Python 3

Мне нужно проверить, имеет ли веб-страница символ авторского права ©, и если да, я извлекаю тексты тега, содержащего символ. Например, для веб-страницы «profile.theguardian.com/signin» целевые тексты ...
вопрос задан: 13 July 2018 20:44
3
ответа

Скребки и петли мета-теги с красивым супом

Ниже находится веб-скребок, который использует красивый суп, чтобы очистить список команд с этого веб-сайта. Каждый столбец данных помещается в массив, где он затем перебирается в CSV-файл. Я бы хотел ...
вопрос задан: 13 July 2018 06:26
3
ответа

Как Вы очищаете страницы AJAX?

Советуйте, как очистить страницы AJAX.
вопрос задан: 11 April 2018 07:35
3
ответа

Как программно войти на сайт к screenscape?

Мне нужна некоторая информация с веб-сайта, это не является моим для получения этой информации, в которую я должен войти к веб-сайту для сбора информации, это происходит через HTML-форму. Как я могу сделать это...
вопрос задан: 11 August 2017 13:37
3
ответа

Скремблирование таблиц html в фреймы данных R с использованием пакета XML

Как я могу очистить таблицы HTML, используя пакет XML? Взять, к примеру, эту страницу википедии о бразильской футбольной команде. Я хотел бы прочитать это в R и получить "список всех матчей, которые Бразилия имеет ...
вопрос задан: 10 November 2016 15:40
3
ответа

Я могу распечатать результат, но он не появляется в моем CSV-файле после скремблирования [duplicate]

Я начинаю писать на python и выскабливать, поэтому у меня все еще есть некоторые трудности, чтобы очистить простую таблицу, которая размещена на этом веб-сайте [http: //www.concursopublico.sp.gov.br/PortalConcurso/noauth / ...
вопрос задан: 31 December 2014 22:52
3
ответа

Какой Синтаксический анализатор HTML является лучшим? [закрытый]

Я кодирую много синтаксических анализаторов. Вплоть до сих пор я использовал HtmlUnit бездисплейный браузер для автоматизации браузера и парсинга. Теперь, я хочу разделить обоих задачи. Поскольку 80% моей работы включают просто парсинг, меня...
вопрос задан: 22 May 2014 07:17
3
ответа

Сброс после входа на веб-страницу через Python [дубликат]

Я рассмотрел другие вопросы, которые имеют подобную проблему, но никто из них не работает для меня. Я работаю над Python 3. Я пытался получить контактную информацию и электронный идентификатор колледжа ...
вопрос задан: 18 November 2013 07:43
3
ответа

Python Получить динамическую веб-страницу Содержание [дубликат]

Я использую Python и BeautifulSoup, чтобы сделать некоторые веб-слома. Но для конкретного веб-сайта: http://www.onthehouse.com.au/property_report/vic/craigieburn_3064/milburn_place?streetNumber=14 Я ...
вопрос задан: 19 December 2012 22:23
3
ответа

Как я могу использовать R (пакеты Rcurl/XML?!) для очистки этой веб-страницы?

У меня есть (несколько сложная) веб-проблема очистки, которую я хочу выполнить и любил бы в некоторое направление (к любому уровню, который Вы испытываете желание совместно использовать), здесь идет: Я хотел бы пройти весь "...
вопрос задан: 22 October 2012 21:05
3
ответа

Проблемы с веб-хостингом при использовании моего perl-скрипта. Нужна помощь в выборе языка для замены perl [закрыто]

У меня есть веб-сайт, который я делаю, и я собирался внедрить в него скрипт на Perl. Этот скрипт переходит на другую страницу, получает файл .csv, читает строки и разбирает то, что мне нужно. Проблема, которую я ...
вопрос задан: 29 November 2011 18:31
3
ответа

Очистить и преобразовать веб-сайт в HTML?

Я не сделал этого за 3 или 4 года, но клиент хочет понизить их динамический веб-сайт в статический HTML. Есть ли любые бесплатные инструменты там, чтобы проверить домен и генерировать рабочие файлы HTML к...
вопрос задан: 12 August 2010 15:30
2
ответа

Как найти тег с определенным текстом с помощью Beautiful Soup?

У меня есть следующий html (разрывы строк отмечены \ n): ... \ n "Некоторый текст:" \ n
\ n некоторое значение \ n ...
вопрос задан: 10 July 2019 04:53
2
ответа

Невозможно вернуть строку и список из одной функции в другую

Я создал скрипт на python для анализа адреса веб-сайтов различных агентств с его целевой страницы и адреса расположения с его внутренней страницы. То, что я не могу понять, как я могу вернуть ...
вопрос задан: 27 March 2019 11:16
2
ответа

Чтение многочисленных таблиц HTML в R

Я пытаюсь собрать таблицы данных html в один фрейм данных и ищу элегантное решение. Есть 255 таблиц, и URL-адреса варьируются в зависимости от двух переменных: год и район Aldermanic. Я знаю ...
вопрос задан: 24 March 2019 06:54
2
ответа

Scrapy не распознает xpath

Я пытаюсь получить данные с этой страницы https://octopart.com/electronic-parts/integrated-circuits-ics, но с помощью кнопки Specs. Я пытаюсь получить названия продуктов с этим кодом, но это не работает. ...
вопрос задан: 21 March 2019 19:39
2
ответа

Выскабливание с просьбами

что не так в моем коде, я пытаюсь получить такой же контент, как в https://koleo.pl/rozklad-pkp/krakow-glowny/radom/19-03-2019_10:00/all/EIP-IC--EIC- EIP-IC-KM-REG, но результат разный, как я хочу. ...
вопрос задан: 19 March 2019 11:00
2
ответа

Python селен скребок отлично работает на окнах, но не на распианец распбиан

Цель этого сценария - вычеркнуть информацию из моего рабочего графика. Полный скрипт прекрасно работает, когда я запускаю его на своем ноутбуке с Windows, но когда я пытаюсь запустить его на Rasian, появляется щелчок. () На "...
вопрос задан: 19 March 2019 00:28
2
ответа

Невозможно получить текст span, используя Python

У меня есть поставщик с веб-страницей для входа, на которой я пытаюсь узнать цену и доступность. В то время как в VBA селекторы работают в Python, я получаю None. Это часть HTML, из которой я получаю цену: ...
вопрос задан: 18 March 2019 13:15
2
ответа

Подождите, пока страница загрузится, прежде чем очищать

Я пытаюсь пересечь несколько страниц футбольного сайта. Все ссылки находятся в списке teamLinks. Пример одной из ссылок: «http://www.premierleague.com//clubs/1/Arsenal/squad?se=79». Я ...
вопрос задан: 17 March 2019 19:12
2
ответа

Json Парсинг из API с Dicts

Я пишу кусок кода, чтобы получить определенную информацию из API Лиги Легенд. У меня все работает нормально и печатаю на консоли, мне даже удалось получить доступ к данным и ...
вопрос задан: 10 March 2019 07:52
2
ответа

Получил пустой список с красивым супом и селеном

https://www.rottentomatoes.com/m/the_lord_of_the_rings_the_return_of_the_king Я хочу получить ТОМАТОМЕТР и АУДИТОРСКИЙ СЧЕТ с этого сайта, но получил пустой список. суп = BeautifulSoup (HTML, HTML ...
вопрос задан: 8 March 2019 08:12
2
ответа

Как нажать на несколько & ldquo; + & rdquo; кнопки на странице в хронологическом порядке и извлекать данные из них с помощью Python?

Мне нужно извлечь номер телефона и ссылки на веб-сайт вместе с названием и страной университетов с веб-сайта. Веб-сайт https: //www.whed.net/results_institutions.php? Chp2 = Бизнес% ...
вопрос задан: 7 March 2019 20:00
2
ответа

Beautifulsoup4 не показывает содержимое таблицы

Я использую Beautifulsoup4 для очистки информации в github. Однако всякий раз, когда я пытаюсь получить данные внутри таблицы, программа просто возвращает табличные теги открытия и закрытия. из bs4 import ...
вопрос задан: 5 March 2019 19:26
2
ответа

Получить номера страниц Селена Python

У меня есть список кнопок страницы. Это HTML-код. < ul class = "artdeco-pagination__pages artdeco-pagination__pages - number" < li class = "artdeco-pagination__indicator artdeco -...
вопрос задан: 5 March 2019 18:34
2
ответа

Невозможно очистить данные в читаемом формате в R из Википедии

Я новичок в R. Я пытаюсь почистить данные из Википедии, но o / p не в удобочитаемом формате. Ниже мой код: библиотека ("rvest") библиотека ("xml2") библиотека ("magrittr") библиотека ("tidyverse") wiki_url < -...
вопрос задан: 4 March 2019 19:45
2
ответа

перебирая выпадающее меню с помощью Selenium и Python

Я пытаюсь просмотреть выпадающее меню по этому адресу: https://www.accuform.com/safety-sign/danger-danger-authorized-personnel-only-MADM006 Так, например, первое выпадающее меню - под ...
вопрос задан: 28 February 2019 16:06
2
ответа

Проблема с получением второй ссылки, когда первая ссылка содержит определенное ключевое слово рядом с ней

Я создал скрипт на python совместно с selenium, чтобы получить первую ссылку (заполненную duckduckgo.com) любого элемента поиска, если только ключевое слово Ad не находится рядом с этой ссылкой, например, на изображении ...
вопрос задан: 25 February 2019 20:25
2
ответа

Как продолжить цикл при очистке веб-страниц?

Я написал простой сценарий, чтобы изучить, как работать с Python. Я выбрал этот URL: https://www.ebay.co.uk/b/Mens-Coats-Jackets/57988/bn_692010 На странице 48 позиций и ...
вопрос задан: 20 February 2019 21:24
2
ответа

Веб-выскабливание Java

Я не могу найти любую хорошую сеть, очищающую основанный на Java API. Сайт, который я должен очистить, не обеспечивает API также; я хочу выполнить итерации по всем веб-страницам с помощью некоторого pageID и извлечь HTML...
вопрос задан: 15 February 2019 08:25