Если я ввожу этот URL в браузер, он возвращает мне действительные данные XML, которые мне интересны. HTTP: //www.facebook.com/ajax/stream/profile.php __a = 1 & profile_id = 36343869811 & фильтр = 2 & ...
У нас есть программа php web scraper, которая может очищать данные в сети. Это работает на localhost. Но мы получаем ошибку "preg_match (): Сбой компиляции: недопустимый диапазон в классе символов в ...
Я пытаюсь очистить текст только от основного текста с помощью python Scrapy, но пока безуспешно. Хотелось бы, чтобы некоторые ученые могли помочь мне здесь, очистив весь текст из тега .
У меня есть следующая структура HTML :. Я пытаюсь создать надежный метод для извлечения второго элемента дайджеста цвета, поскольку в DOM будет много таких тегов. <таблица> <тело> &...
Итак, я прочитал Crawling с аутентификацией сеанса в Scrapy, и я завис, я на 99% уверен, что мой код синтаксического анализа верен, я просто не считаю, что вход в систему перенаправляется и является ...
Мой веб-сайт многоязычный, и у меня есть кнопка «Нравится» в FB. Я бы хотел, чтобы похожие сообщения были на разных языках. Согласно документации Facebook, если я использую метатеги og: locale и og: locale: ...
Я пытаюсь "дефронтпагифицировать" html сайта, созданного MS FrontPage, и пишу для этого скрипт BeautifulSoup. Однако я застрял на той части, где я пытаюсь отделить определенный ...
Мы хотим настроить небольшое изображение Honeypot в наших HTML-телах для обнаружения скребков / плохих ботов. Кто-нибудь установил что-то вроде этого раньше? Мы думали, что лучший способ пойти на это было бы: a) ...
Я пытаюсь очистить http://www.nscb.gov.ph/ggi/database.asp, особенно все таблицы, которые вы получаете при выборе муниципалитеты / провинции. Я использую python с lxml.html и механизирую. мой ...
У меня есть паук, который я написал, используя фреймворк Scrapy. У меня возникли проблемы с запуском конвейеров. У меня есть следующий код в моем pipelines.py: class FilePipeline(object): ...