1
ответ

Как почистить сайт, на котором трудно читать таблицу (панды и красивый суп)?

Я пытаюсь очистить данные с https://www.seethroughny.net/payrolls/110681345, но с таблицей трудно иметь дело. Я перепробовал много вещей. импорт панд как pd импорт ssl импорт csv ssl ....
вопрос задан: 24 March 2019 19:16
1
ответ

PyQt4 to PyQt5, Красивый суп, Ядро умерло, перезапуск

Я запускаю новую версию Anaconda «Python 3.7.1 64-bit | Qt 5.9.6 | PyQt5 5.9.2 | Windows 10 | Spyder 3.3.2 »и не повезло, портируя Youtube Sentdex« Динамическая очистка JavaScript - Веб ...
вопрос задан: 24 March 2019 17:07
1
ответ

извлечение данных с помощью Beautifulsoup из вики

Я довольно новичок в этом. То, что я пытаюсь сделать, это иметь таблицу с distrcits и их различными окрестностями, но мой окончательный код просто перечисляет все окрестности в виде списка без ...
вопрос задан: 24 March 2019 02:47
1
ответ

Очистка и печать всех имен и тегов в сети на основе определенных тегов

у всех имен в моей ссылке HTML есть один признак хорошо? (я использую красивый суп) Я хочу вырезать и напечатать все имена с их тегами, если их теги == 'конкретная строка' хорошо? мои классы зовут div мои id имена = '...
вопрос задан: 21 March 2019 15:48
1
ответ

Выпуск Python bs4

Я написал небольшое приложение на Python, но оно не работает, как я планировал. Я хотел, чтобы программа спросила пользователя, сколько изображений с выбранным тегом из Unsplash он / она хочет сохранить на своем диске. Рез = ...
вопрос задан: 18 March 2019 22:30
1
ответ

Соскоб в Интернете - обработка несмертельных ошибок

Использование веб-скребков (bs4, selenium) и выяснение того, существует ли лучший способ обработки исключений, не являющихся фатальными (т.е. продолжайте работу после исключения) В моем коде много исключений try
вопрос задан: 18 March 2019 14:22
1
ответ

Python - Beautiful Soup - Как отфильтровать извлеченные данные по ключевым словам?

Я хочу очистить данные веб-сайтов, используя Beautiful Soup и запросы, и я зашел так далеко, что получил нужные данные, но теперь я хочу отфильтровать их: из bs4 import запросов импорта BeautifulSoup ...
вопрос задан: 17 March 2019 22:50
1
ответ

Группировать результаты из веб-разбивки на разделы

Пытаясь узнать, как использовать Python для поиска в Интернете, я получил меню ланча с этого http://bramatno8.kvartersmenyn.se/ Страница построена так: < div class = "menu" > < & сильный GT; ...
вопрос задан: 14 March 2019 07:21
1
ответ

Извлечь текст после < hr > тег в BeautifulSoup

У меня есть скрипт, который извлекает данные со страницы. Я могу очистить большую часть этого, но есть немного текста, который появляется после тега "hr" который я не уверен, как скрести. HTML-код выглядит следующим образом: < ...
вопрос задан: 11 March 2019 13:59
1
ответ

Почему я не могу поцарапать мою домашнюю страницу в Facebook?

Я хочу очистить мою домашнюю страницу в Facebook, которая всегда заходит на мою машину, используя python и beautifulsoup. Я использую код ниже: из urllib.request импортировать urlopen как urlo из bs4 import ...
вопрос задан: 9 March 2019 17:00
1
ответ

Как использовать потоки с селеном для очистки веб-страниц?

Моя главная цель - собрать как можно больше профильных ссылок о Академии Хана. А затем соберите некоторые конкретные данные по каждому из этих профилей. Моя цель в этом вопросе - использовать многопоточность, чтобы ...
вопрос задан: 7 March 2019 02:09
1
ответ

Как найти дочерний элемент дочернего элемента, используя Beautiful Soup

Я новичок в питоне. Я хочу использовать BeautifulSoup, чтобы получить дату публикации на форуме. Я пробовал много способов, но не смог получить правильный результат. Вот моя проблема: < td class = by > < & цитируют ...
вопрос задан: 5 March 2019 19:08
1
ответ

Как извлечь ссылки и обрабатывать страницу, как она загружается снова и снова, используя Python Beautifulsoup

Tring для извлечения ссылок и хотите справиться с загрузкой. но даже не ссылки. код: из bs4 import Красивые запросы на импорт BeautifulSoup r = запросы.
вопрос задан: 4 March 2019 13:34
1
ответ

Как добавить несколько тегов перед одним тегом BeautifulSoup

У меня есть один тег, мне нужно добавить три тега, прежде чем он будет иметь другой текст, я попробовал как: ['class'] = "btn btn -...
вопрос задан: 4 March 2019 06:08
1
ответ

Удаление динамически сгенерированной таблицы HTML без идентификатора и класса с BeautifulSoup

Я сгенерировал таблицу с помощью Python Selenium, и исходный код сгенерированной таблицы выглядит следующим образом (код имеет < TABLE cellSpacing = 0 cellPadding = 0 width = 806 border = 0 > ...
вопрос задан: 3 March 2019 17:25
1
ответ

скрести без селена, питона

Я хочу вычеркнуть цену с этой страницы https://www.stenaline.pl/book#booking/SailingsFaresByTripType (появляется после отправки). На самом деле я сделал это с помощью Selenium. И теперь я пытаюсь сделать это с запросами ...
вопрос задан: 2 March 2019 13:13
1
ответ

Непоследовательная очистка данных таблиц

Я пытаюсь извлечь данные таблицы из таблицы с этой веб-страницы. http://www.espn.com/college-sports/basketball/recruiting/playerrankings/_/view/espnu100/sort/rank/class/2019. Тем не менее, когда я пытаюсь и ...
вопрос задан: 2 March 2019 07:30
1
ответ

автоматический просмотр веб-сайта

Отсюда я получил помощь для сканирования сайта law.go.kr с приведенным ниже кодом. Я пытаюсь сканировать другие сайты, такие как http://lawbot.org, http://law.go.kr, https://casenote.kr. Но проблема в том, что у меня нет ...
вопрос задан: 26 February 2019 12:36
1
ответ

Проблема с утилизацией данных диаграммы Understat с использованием Selenium

Я пытаюсь очистить данные диаграммы на вкладке «Сроки» на странице https://understat.com/match/9457. Мой подход заключается в использовании BeautifulSoap и Selenium, но я не могу заставить его работать. Вот мой питон ...
вопрос задан: 25 February 2019 14:19
1
ответ

Очистка AJAX-страницы с запросами

Я хотел бы проанализировать результаты этого процесса бронирования. Просматривая вкладку сети, я обнаружил, что данные извлекаются с помощью AJIAX GET по этому адресу: https: //shop.caremar.it / ...
вопрос задан: 23 February 2019 16:47
1
ответ

Как предотвратить ошибку, когда веб-соскоб с Python и значение не существует?

Прямо сейчас я пытаюсь просмотреть сайт недвижимости и собрать информацию о свойствах. У меня есть код, который проходит через список свойств, получает данные, а затем переходит на страницу для каждого свойства ...
вопрос задан: 21 February 2019 04:33
1
ответ

Как добавить словарь в ссылку?

Я готовлюсь отказаться от BS4 для своей школы и хочу извлечь содержание словаря из якоря ссылок. Как извлечь содержимое словаря ctdata? Ниже приведены подробности: ...
вопрос задан: 20 February 2019 07:36
1
ответ

Очистка веб-страницы Java

Я нашел и прочитал довольно много статей о соскобе, но я как-то разбит как новичок. Я хочу получить данные из таблицы (https: //www.senamhi.gob.pe/mapas/mapa-estaciones/_dat_esta_tipo.php? ...
вопрос задан: 18 February 2019 21:00
1
ответ

Разбор HTML-тегов br с помощью bs4

Я хочу проанализировать HTML-страницы с большим количеством параллельных < br /> теги, такие как < td > "а" < br > "b" < br > "c" < / td > Я хочу хранить эти данные отдельно как a = ["a"], b = ["b" ...
вопрос задан: 18 February 2019 08:31
1
ответ

Скрипт для извлечения всех изображений с веб-страницы

Я пытаюсь использовать следующий код для извлечения всех изображений со страницы, но он выдает ошибку «Нетипичный» объект не имеет атрибута «группа». Может кто-нибудь сказать мне, в чем здесь проблема? импортировать ре ...
вопрос задан: 18 February 2019 04:32
1
ответ

Соскреб в сети с BeautifulSoup возвращает NoneType

Я пытаюсь очистить сайт с помощью BeautifulSoup и написал следующий код: импортировать запросы из bs4. Импортировать BeautifulSoup page = запросы.get ("https://gematsu.com/tag/media-create-sales") ...
вопрос задан: 28 January 2019 18:22
1
ответ

Web Scraper возвращает пустой HTML-файл во время работы браузера Chrome; уже попробовал UserAgent

Я новичок, только изучающий Python, однако для нашей дипломной работы нам нужны данные со следующего веб-сайта (это только муниципальные финансовые данные правительства Латвии): https: //e2.kase ....
вопрос задан: 24 January 2019 18:47
1
ответ

Попытка очистить страницу одним cookie

Я пытаюсь очистить таблицу от URL. Я уже некоторое время пользуюсь библиотекой запросов вместе с красивым супом, но я не хочу рисковать, используя веб-драйвер, как я уже ...
вопрос задан: 24 January 2019 05:51
1
ответ

BeautifulSoup - веб-сканер ищет дублированные ссылки

Я пытаюсь сделать так, чтобы веб-сканер рекурсивно находил внешнюю гиперссылку веб-страницы. С помощью следующего кода сканер работает хорошо, но он ищет и вставляет ссылку, которая уже сохранена в базе данных. Я ...
вопрос задан: 20 January 2019 15:06
1
ответ

Как очистить время общественного транспорта в реальном времени, используя Python?

https://www.ptv.vic.gov.au/next5/diva/10018306/line/9777/2 Я пытаюсь получить время / время (время вылета) и пункт назначения, но страница обновляется каждые 60 секунд, и я не в состоянии получить эту информацию. ...
вопрос задан: 20 January 2019 14:03