1
ответ

Очистите несколько абзацев в соответствии с определенной схемой

На этом веб-сайте газеты отдельные пункты этой статьи перечислены в отдельном теге объекты, в которых каждый < class > Имя атрибута начинается со слова article. Как я могу получить все параграфы, где ...
вопрос задан: 19 January 2019 22:07
1
ответ

Как исправить изображение скачать питон

Я не могу сохранить изображение, полученное из супа-объекта, источник изображения будет правильным, если я скопирую его и вставлю в браузер, однако я не могу загрузить его. Я использовал BeautifulSoup, чтобы найти изображение ...
вопрос задан: 19 January 2019 17:36
1
ответ

Ползание Крейглишта с питоном

Я пытаюсь сканировать задания Craglist, используя python (я не использую scrapy). Может кто-нибудь решить эту проблему ниже? пожалуйста, не говорите о scrapy Это URL: https://chicago.craigslist.org/ на ...
вопрос задан: 18 January 2019 18:49
1
ответ

Как избежать дублирования информации из HTML с помощью .querySelectorAll в VBA?

Я пытаюсь собрать данные с веб-сайта, на котором хранится информация об автомобильных авариях в США. Для этого мне нужно перебрать все случаи на сайте и сохранить таблицы в Excel ...
вопрос задан: 18 January 2019 13:45
1
ответ

Почему я не могу очистить весь контент в атрибуте data-src этого HTML

Я пытаюсь очистить все данные внутри элемента «data-src» этого HTML-текста: [< div class = "js-delayed-image-load" data-alt = "Человек закрывает лицо во время песчаной бури в Каир, Египет, 16 ...
вопрос задан: 18 January 2019 10:08
1
ответ

Как экспортировать эти данные, разделенные несколькими столбцами в одной строке, в .csv или .xls, используя Python в BeautifulSoup?

В настоящее время я храню эти данные в качестве переменной результата. ['Дата розыгрыша:'] ['Дата розыгрыша:'] [''] [''] [''] ['Дата розыгрыша: 2019-01-15'] [''] ['Лотерея Пердана'] [] ['F', '2771', 'M', '0133', 'A', '6215'] [] ...
вопрос задан: 18 January 2019 05:57
1
ответ

Как разобрать таблицу из Википедии с помощью пакета htmltab?

Все, я пытаюсь проанализировать 1 таблицу, расположенную здесь https://en.wikipedia.org/wiki/List_of_countries_and_dependencies_by_population#Sovereign_states_and_dependencies_by_population. И я хотел бы использовать ...
вопрос задан: 18 January 2019 03:42
1
ответ

Устранение проблем веб-циклов с расчетом и привязкой к таблице сборки R

Я пытаюсь создать таблицу данных с веб-очисткой, используя символы числового тикера с помощью запроса, который извлекает данные о цене и скидках за 1 год с веб-сайта хоста для определенного фонда. У меня есть ...
вопрос задан: 17 January 2019 19:21
1
ответ

Python BeautifulSoup Извлечение данных из заголовка

Это продолжение другого вопроса. Спасибо за помощь. У меня есть код для циклического просмотра страницы и создания фрейма данных. Я пытаюсь добавить третий кусок информации, но это ...
вопрос задан: 17 January 2019 16:36
1
ответ

Очистка веб-страниц с помощью VBA для возврата данных при соответствующих условиях

Надеюсь, этого вопроса нет в другом посте, так как я искал и не нашел ответа. Я также довольно новичок в программировании, но особенно в утилизации в Интернете. Если вы, ребята, знаете что-нибудь хорошее, закончите ...
вопрос задан: 17 January 2019 15:51
1
ответ

Как получить переменные тега скрипта с веб-сайта с использованием Python

Я пытаюсь вытащить переменную с именем meta в тег скрипта, используя Python. Я использовал селен, чтобы сделать это раньше, но селен слишком медленный для того, что я пытаюсь достичь. Есть ли другой способ ...
вопрос задан: 17 January 2019 15:44
1
ответ

получить первую строку текста внутри тега, используя очистку веб-страниц

Мне нужно получить первую строку текста внутри тега, используя код Python для очистки веб-страниц. ожидаемый результат: 22 сентября 1995 г. Код html выглядит следующим образом < div class = "text-block" > < h4 class = "...
вопрос задан: 17 January 2019 07:14
1
ответ

Загрузка всего набора данных с FTP и использование определенных файлов с регулярным выражением для обработки данных в R

У меня есть следующий публичный набор данных на FTP. Я хочу загрузить из нее всю папку HistoricalOffers. После загрузки всей папки я хочу использовать только файлы в каждой папке, которая запускается ...
вопрос задан: 17 January 2019 03:22
1
ответ

request.get () застревает

Здравствуйте, я пытаюсь очистить некоторые данные с веб-сайта, и request.get () что-то догоняет. вот мой код: page_url = front_end + str (i) + '/' page = запросы.get (page_url), поэтому я хочу это ...
вопрос задан: 17 January 2019 01:54
1
ответ

Переключение между циклами VBA в таблице сгенерированных JavaScript

Я пытаюсь проверить все поля в сгенерированной JS таблице с именем tblItems. Я пытался получить getElementsByTagName ("td"), но он просто загружает все как объект HTML, и я не могу использовать InStr, чтобы найти ...
вопрос задан: 16 January 2019 20:27
1
ответ

Как сделать несколько HTTP-запросов из облачной функции Google (Cheerio, Node.js)

МОЯ ПРОБЛЕМА: я создаю веб-скребок с Cheerio, Node.js и Google Cloud Functions. Проблема в том, что мне нужно сделать несколько запросов, а затем записать данные из каждого запроса в базу данных Firestore ...
вопрос задан: 16 January 2019 11:24
1
ответ

Scrapy не возвращает результаты для определенных тегов

Я только начал использовать Scrapy сегодня, но у меня есть опыт программирования на javascript, поэтому, пожалуйста, потерпите меня, я дам очень подробное объяснение: я использую GramReport для анализа некоторых ...
вопрос задан: 16 January 2019 06:03
1
ответ

Трудность входа в учетную запись с библиотекой запросов Python

Я пытаюсь создать программу, которая входит в мою учетную запись MyPanera и возвращает информацию о том, какие награды я заработал и сколько времени до получения следующего вознаграждения. Однако у меня возникли трудности ...
вопрос задан: 16 January 2019 00:38
1
ответ

Почему SendKey Enter не работает с браузером Chrome

Я пытаюсь проверить несколько Vins, введенных в Excel в браузере Chrome, этот код откроет браузер и введет их, но он не нажмет Enter, чтобы нажать кнопку. Не уверен, что я делаю не так ...
вопрос задан: 15 January 2019 21:16
1
ответ

Python Web scraping: слишком медленное выполнение: как оптимизировать скорость

Я написал программу утилизации в Python. Он работает правильно, но для его выполнения требуется 1,5 часа. Я не уверен, как оптимизировать код. Логика кода заключается в том, что в каждой стране много ASN ...
вопрос задан: 15 January 2019 18:33
1
ответ

Формула, написанная в модуле Producation #VALUE

С помощью внешних источников у меня есть этот код, который принимает широту и долготу и извлекает zipcodes. Вот код: Public Function ReverseGeoCode (myInput1 As String, myInput2 As String) ...
вопрос задан: 13 July 2018 22:45
1
ответ

Scrapy: как передавать ссылки

Я не могу передавать ссылки. При запуске паука я не получаю данные с кодом. Я новичок в Scrapy import scrapy от movie.items импортирует класс AfishaCinema AfishaCinemaSpider (scrapy ....
вопрос задан: 13 July 2018 08:30
1
ответ

Загрузите все веб-страницы и сохраните их в виде html-файла с помощью urllib.request

Я могу сохранить несколько веб-страниц с использованием этих кодов; однако, я не могу увидеть правильный просмотр веб-сайта после сохранения их в качестве html. Например, тексты в таблице проскальзывают и изображения не видны. Мне нужно ...
вопрос задан: 13 July 2018 07:30
1
ответ

Используя urllib и BeautifulSoup для получения информации от сети с Python

Я могу получить страницу HTML с помощью urllib и использовать BeautifulSoup для парсинга страницы HTML, и похоже, что я должен генерировать файл, который будет считан из urllib импорта BeautifulSoup...
вопрос задан: 14 August 2017 07:58
1
ответ

Очистить весь веб-сайт [закрыто]

Я ищу рекомендации для программы для очистки и загрузки всего корпоративного веб-сайта. Сайт работает на CMS, которая перестала работать, и ее починка стоит дорого, и мы ...
вопрос задан: 11 August 2017 13:29
1
ответ

Pandas экспортирует только 1 строку в файл CSV [дубликат]

Я новичок в python и пытаюсь очистить данные с веб-сайта. Код ниже возвращает информацию, которую я ищу, но при попытке экспортировать данные в CSV он включает только последнюю строку ...
вопрос задан: 22 June 2015 23:27
1
ответ

обход полного сайта с DOM Document в PHP, предоставленный пользователем [duplicate]

Я делаю веб-скребок, я могу получить суб-url от пользователя, которому задан url, и загрузить контент с подстраниц. Я использую getElementsByTagName ('body'), в domdocument. но как я могу получить конкретные данные ...
вопрос задан: 28 May 2014 18:05
1
ответ

Очистить от CENTRAL iframe [duplicate]

Я работаю над проектом по очистке данных из Библиотеки Кокрейн (CENTRAL). Например, со страницы, подобной этой, я хочу получить дизайн исследования статей (т. Е. RCT). Чтобы сделать это, я написал следующее ...
вопрос задан: 12 April 2014 10:40
1
ответ

Как изолировать единственный элемент от очищенной веб-страницы в R

Я хочу использовать R для очистки этой страницы: (http://www.fifa.com/worldcup/archive/germany2006/results/matches/match=97410001/report.html) и другие, для получения бомбардиров и времена. До сих пор это что...
вопрос задан: 5 September 2013 00:07
1
ответ

ASP HttpWebRequest и перенаправление

Хорошо, у меня есть клиент, делающий POST к серверу с некоторыми данными. Сервер получает сообщение и отвечает перенаправлением. Проблема состоит в том, что клиент не делает перенаправлений. Кроме того, я попытался проверить...
вопрос задан: 1 December 2011 15:30