1
ответ

Рекурсивно загружайте страницы XML, используя ссылку href с Python [закрыто]

У меня есть страница XML со ссылкой href, которая ведет меня на следующую страницу, а последняя страница XML не имеет элемента href. Мне нужно скачать все XML рекурсивно и искать соответствующий код Python, который ...
вопрос задан: 9 March 2019 23:44
1
ответ

Соскоб в динамическом контенте [дубликаты]

У меня есть общий вопрос об извлечении из динамического контента, я пытаюсь проанализировать страницы Reddit с селеном, новый контент загружается при прокрутке вниз, это лучший способ сделать это, чтобы сохранить HTML ...
вопрос задан: 9 March 2019 17:33
1
ответ

Почему я не могу поцарапать мою домашнюю страницу в Facebook?

Я хочу очистить мою домашнюю страницу в Facebook, которая всегда заходит на мою машину, используя python и beautifulsoup. Я использую код ниже: из urllib.request импортировать urlopen как urlo из bs4 import ...
вопрос задан: 9 March 2019 17:00
1
ответ

Как использовать потоки с селеном для очистки веб-страниц?

Моя главная цель - собрать как можно больше профильных ссылок о Академии Хана. А затем соберите некоторые конкретные данные по каждому из этих профилей. Моя цель в этом вопросе - использовать многопоточность, чтобы ...
вопрос задан: 7 March 2019 02:09
1
ответ

Очистка веб-страницы AJAX с использованием Python и запросов

Я попытался очистить эту страницу с помощью метода Beautifulsoup find, но не смог найти значение таблицы на странице HTML. Я обнаружил, что веб-сайт генерирует данные мгновенно, когда я загружаю страницу ...
вопрос задан: 6 March 2019 08:42
1
ответ

Используя LXML с Html, Requests и ETree, он дает все HTML-теги в дополнение к тексту, и я не знаю, почему

Следующий вопрос из этого: используя LXML с Html, Requests и ETree, он дает ссылки, но не позволяет мне искать ссылки для конкретного текста. Я хотел бы знать, какие у меня есть лучшие варианты и что ...
вопрос задан: 5 March 2019 18:29
1
ответ

использование селена для отображения «следующих» результатов поиска с использованием ссылок jscript _doPostBack

В результатах поиска на сайте jobquest (http://jobquest.detma.org/JobQuest/Training.aspx) я хотел бы использовать селен, чтобы щелкнуть ссылку «next», чтобы следующая страница разбивалась на страницы из 20 записей ...
вопрос задан: 4 March 2019 16:21
1
ответ

соскабливание ссылок на YouTube с веб-страницы

Я пытался очистить ссылки YouTube с веб-страницы, но ничего не помогло. Это картина того, что я пытался очистить. Это код, который я пробовал совсем недавно: youtube_link = soup ....
вопрос задан: 3 March 2019 21:35
1
ответ

Удаление динамически сгенерированной таблицы HTML без идентификатора и класса с BeautifulSoup

Я сгенерировал таблицу с помощью Python Selenium, и исходный код сгенерированной таблицы выглядит следующим образом (код имеет < TABLE cellSpacing = 0 cellPadding = 0 width = 806 border = 0 > ...
вопрос задан: 3 March 2019 17:25
1
ответ

скрести без селена, питона

Я хочу вычеркнуть цену с этой страницы https://www.stenaline.pl/book#booking/SailingsFaresByTripType (появляется после отправки). На самом деле я сделал это с помощью Selenium. И теперь я пытаюсь сделать это с запросами ...
вопрос задан: 2 March 2019 13:13
1
ответ

Непоследовательная очистка данных таблиц

Я пытаюсь извлечь данные таблицы из таблицы с этой веб-страницы. http://www.espn.com/college-sports/basketball/recruiting/playerrankings/_/view/espnu100/sort/rank/class/2019. Тем не менее, когда я пытаюсь и ...
вопрос задан: 2 March 2019 07:30
1
ответ

Невозможно удалить первые два столбца таблицы при очистке

Я создал макрос в VBA, используя запрос xmlhttp для анализа некоторых табличных данных с веб-страницы. Я могу получить все содержимое этой таблицы, когда попробую свой скрипт ниже. Тем не менее, мое намерение состоит в том, чтобы получить ...
вопрос задан: 2 March 2019 06:28
1
ответ

Не удается сохранить и закрыть вновь созданную книгу в пользовательской папке

Я создал макрос, который может анализировать названия некоторых фильмов с торрент-сайта. Что я хочу сделать сейчас (мой сценарий может удовлетворять первым трем требованиям, кроме четвертого): 1. ...
вопрос задан: 1 March 2019 22:01
1
ответ

R Selenium / Docker WebServer для загрузки файла с интерактивного сайта

Я пытаюсь создать несколько шахматных игр на сайте chess.com, используя R Selenium. Идея состоит в том, чтобы дважды щелкнуть на веб-сайте, используя удаленный сервер Docker. Ссылка в примере приводит ...
вопрос задан: 1 March 2019 20:55
1
ответ

Как разобрать таблицы с простым текстом? (несколько строк)

Я хочу разобрать таблицу, которая легко читается визуально, но в которой отсутствуют реальные шаблоны. Мне бы хотелось, чтобы он был в виде словаря на Python, но в конечном итоге я превращу его в фрейм данных. Там ...
вопрос задан: 28 February 2019 10:04
1
ответ

веб-очистка - программа не читает тег

Я пытаюсь переписать этот веб-сайт по адресу: http://acfarma.com.br/encontre-uma-farmacia/?cidade=Nova%20Veneza&bairro=CENTRO. Ожидаемый результат - печать текста. И я сделал это: запросы на импорт ...
вопрос задан: 27 February 2019 14:25
1
ответ

Итерация по списку элементов для нескольких API response.get

Как мне перебрать список, чтобы добавить его в request.get? запросы на импорт, json url = "http://www.omdbapi.com/?t=" # data = "Титаник" data = "Титаник", "Аватар" title_url = url + data ...
вопрос задан: 27 February 2019 01:14
1
ответ

кукловод: не могу войти и перебрать URL

Привет, ребята! Я хочу зайти на сайт и после проверки подлинности хочу пройтись по заданному набору URL и очистить данные. То, что я собираюсь сделать, может быть описано этим примером, однако я получаю необработанное обещание ...
вопрос задан: 26 February 2019 13:06
1
ответ

Email Python Script Output

Я только что закончил создание своего первого скрипта для поиска новостей в сети, и я вполне доволен им, хотя код выглядит не очень хорошо. Мне было интересно, как я должен отправлять вывод ...
вопрос задан: 26 February 2019 06:48
1
ответ

Проблема с утилизацией данных диаграммы Understat с использованием Selenium

Я пытаюсь очистить данные диаграммы на вкладке «Сроки» на странице https://understat.com/match/9457. Мой подход заключается в использовании BeautifulSoap и Selenium, но я не могу заставить его работать. Вот мой питон ...
вопрос задан: 25 February 2019 14:19
1
ответ

Проблема выбора нескольких ссылок на сайте - Python & amp; Селен

Я довольно плохо знаком с веб-соскоб. Я пытаюсь написать что-то на python с селеном, который будет автоматически входить на сайт и нажимать несколько вариантов из выпадающего меню. Когда все эти ...
вопрос задан: 23 February 2019 22:51
1
ответ

Очистка AJAX-страницы с запросами

Я хотел бы проанализировать результаты этого процесса бронирования. Просматривая вкладку сети, я обнаружил, что данные извлекаются с помощью AJIAX GET по этому адресу: https: //shop.caremar.it / ...
вопрос задан: 23 February 2019 16:47
1
ответ

Скопируйте данные соскоба на другой лист

Я использую приведенный ниже код для очистки части данных с веб-страницы. Sub Scrape () Set HTML_Content = CreateObject ("htmlfile") 'Получить содержимое веб-страницы в объект HTMLFile с помощью CreateObject ("msxml2 ....
вопрос задан: 22 February 2019 12:37
1
ответ

Как предотвратить ошибку, когда веб-соскоб с Python и значение не существует?

Прямо сейчас я пытаюсь просмотреть сайт недвижимости и собрать информацию о свойствах. У меня есть код, который проходит через список свойств, получает данные, а затем переходит на страницу для каждого свойства ...
вопрос задан: 21 February 2019 04:33
1
ответ

Web Scraper возвращает пустой HTML-файл во время работы браузера Chrome; уже попробовал UserAgent

Я новичок, только изучающий Python, однако для нашей дипломной работы нам нужны данные со следующего веб-сайта (это только муниципальные финансовые данные правительства Латвии): https: //e2.kase ....
вопрос задан: 24 January 2019 18:47
1
ответ

Попытка очистить страницу одним cookie

Я пытаюсь очистить таблицу от URL. Я уже некоторое время пользуюсь библиотекой запросов вместе с красивым супом, но я не хочу рисковать, используя веб-драйвер, как я уже ...
вопрос задан: 24 January 2019 05:51
1
ответ

Как очистить время общественного транспорта в реальном времени, используя Python?

https://www.ptv.vic.gov.au/next5/diva/10018306/line/9777/2 Я пытаюсь получить время / время (время вылета) и пункт назначения, но страница обновляется каждые 60 секунд, и я не в состоянии получить эту информацию. ...
вопрос задан: 20 January 2019 14:03
1
ответ

Введите дату с помощью Selenium

Я пытаюсь ввести дату на веб-странице, используя селен. Я использовал этот код следующим образом: из селен импорта веб-драйвера driver = webdriver.Firefox ()
вопрос задан: 20 January 2019 09:35
1
ответ

Как я могу получить данные с этого веб-сайта?

Здесь есть сайт (http://www.tsetmc.com/Loader.aspx?ParTree=151311&i=46741025610365786#), где каждое поле этой таблицы (обозначенное желтыми квадратами) показывает информацию об одном конкретном дне. ...
вопрос задан: 20 January 2019 08:38
1
ответ

Скребок запрашивает изображение повреждено

Первый раз пытаюсь сделать что-то на питоне. Решил, что это был img-шабер. Он найдет и загрузит все изображения, но все они повреждены. Нашел информацию о неправильном Unicode в BeatySoup, но я сделал ...
вопрос задан: 20 January 2019 07:45