2
ответа

Использование Ruby и Ubuntu с оптическим распознаванием символов

Я - студент университета, и пора купить учебники снова. Эта четверть там является более чем 20 книгами, в которых я нуждаюсь для классов. Обычно это не было бы таким грандиозным предприятием, поскольку я просто скопирую и вставлю...
вопрос задан: 9 December 2009 21:58
2
ответа

Очистка Библиотеки для PHP - phpQuery?

Я ищу библиотеку PHP, которая позволяет мне фрагментировать веб-страницы и заботится обо всех cookie и предварительном заполнении форм со значениями по умолчанию, это - то, что раздражает меня больше всего. Я устал от...
вопрос задан: 29 October 2009 18:30
2
ответа

Как использовать WebClient. DownloadDataAsync () метод в этом контексте?

Мой план состоит в том, чтобы сделать, чтобы пользователь записал название фильма в моей программе, и моя программа вытянет appropiate информацию асинхронно, таким образом, UI не замерзнет. Вот код: общедоступный класс IMDb...
вопрос задан: 18 October 2009 20:44
2
ответа

Красивый Суп не может найти класс CSS, если объект имеет другие классы, также

если страница будет иметь <класс отделения = "class1"> и <p класс = "class1">, то soup.findAll (Правда, 'class1') найдет их обоих. Если это будет иметь <p класс = "class1 class2">, тем не менее, то это не бу
вопрос задан: 7 August 2009 03:34
2
ответа

XPath для Парсинга “SRC” от тега img?

Прямо сейчас я успешно захватил полный элемент от страницы HTML с этим://img [@class ='photo-large'], например, это возвратило бы это: <img src = класс "http://example.com/img.jpg" ='photo-...
вопрос задан: 24 July 2009 19:22
2
ответа

веб-очистка, чтобы заполнить (и получить) ищет формы?

Я задавался вопросом, возможно ли "автоматизировать" задачу ввода в записях для поиска форм и извлечения соответствий от результатов. Например, у меня есть список статей в журнале, для которых я был бы...
вопрос задан: 23 July 2009 07:11
2
ответа

Разработка поискового робота и скребка для механизма вертикального поиска

Я должен разработать механизм вертикального поиска как часть веб-сайта. Данные для поисковой системы прибывают из веб-сайтов определенной категории. Я предполагаю для этого, у меня должен быть поисковый робот, который проверяет несколько (...
вопрос задан: 5 July 2009 17:14
2
ответа

Анализ экранных данных сайт с asp.net формирует вход в систему в C#?

Было бы возможно записать экранный скребок для веб-сайта, защищенного входом в систему формы. У меня есть доступ на сайт, конечно, но я понятия не имею, как войти в сайт и сохранить мои учетные данные в C#...
вопрос задан: 23 May 2009 16:43
2
ответа

Что хороший инструмент к экранному царапанью с поддержкой JavaScript? [закрытый]

Существует ли хороший набор тестов или комплект инструментальных средств, который может автоматизировать навигацию веб-сайта - с поддержкой JavaScript - и собрать HTML из страниц? Конечно, я могу выскоблить прямой HTML BeautifulSoup...
вопрос задан: 24 September 2008 03:12
1
ответ

Python - Beautiful Soup - Как отфильтровать извлеченные данные по ключевым словам?

Я хочу очистить данные веб-сайтов, используя Beautiful Soup и запросы, и я зашел так далеко, что получил нужные данные, но теперь я хочу отфильтровать их: из bs4 import запросов импорта BeautifulSoup ...
вопрос задан: 17 March 2019 22:50
1
ответ

Извлечь текст после < hr > тег в BeautifulSoup

У меня есть скрипт, который извлекает данные со страницы. Я могу очистить большую часть этого, но есть немного текста, который появляется после тега "hr" который я не уверен, как скрести. HTML-код выглядит следующим образом: < ...
вопрос задан: 11 March 2019 13:59
1
ответ

соскабливание ссылок на YouTube с веб-страницы

Я пытался очистить ссылки YouTube с веб-страницы, но ничего не помогло. Это картина того, что я пытался очистить. Это код, который я пробовал совсем недавно: youtube_link = soup ....
вопрос задан: 3 March 2019 21:35
1
ответ

Очистка веб-страницы Java

Я нашел и прочитал довольно много статей о соскобе, но я как-то разбит как новичок. Я хочу получить данные из таблицы (https: //www.senamhi.gob.pe/mapas/mapa-estaciones/_dat_esta_tipo.php? ...
вопрос задан: 18 February 2019 21:00
1
ответ

Webscraping jTable со скрытыми столбцами?

В настоящее время я пытаюсь настроить веб-браузер в Python для следующей веб-страницы: https://understat.com/team/Juventus/2018 специально для «команды игроков jTable», которую мне удалось очистить ...
вопрос задан: 18 January 2019 20:35
1
ответ

Опции для веб-очистки - версия C++ только

Я ищу хорошую библиотеку C++ для веб-очистки. Это должен быть C/C++ и ничто иное, поэтому не направляйте меня к Опциям для очистки HTML или другого ТАК вопросы/ответы, где C++ даже не...
вопрос задан: 23 May 2017 12:34
1
ответ

Python Scrapy, как определить конвейер для объекта?

Я использую пестрый для проверки различных сайтов для каждого сайта, у меня есть Объект (другая информация извлечена) ну, например, у меня есть универсальный конвейер (большей частью информации является то же), но теперь я...
вопрос задан: 2 November 2015 16:10
1
ответ

Получая подобные Facebook сводки ссылки (заголовок, сводные, соответствующие изображения) использование Python

Я хотел бы копировать функциональность что использование Facebook для парсинга ссылки. При представлении ссылки в состояние Facebook их система выходит и получает предложенный заголовок, сводку и...
вопрос задан: 22 April 2013 21:30
1
ответ

Как извлечь ссылки из веб-страницы с помощью lxml, XPath и Python?

У меня есть этот запрос xpath:/html/body//tbody/tr [*]/td [*]/a [@title] / @href Это извлекает все ссылки с атрибутом заголовка - и дает href в дополнении средства проверки FireFox Xpath. Однако я не могу...
вопрос задан: 1 March 2013 17:20
1
ответ

HTML царапанья сгенерирован JavaScript с Python

Я должен выскоблить сайт Python. Я получаю исходный HTML-код с urlib модулем, но я должен очистить также некоторый HTML-код, который сгенерирован функцией JavaScript (который включен в...
вопрос задан: 24 November 2011 09:56
1
ответ

Есть ли способ заставить NHibernate выдавать подсказку о взаимной блокировке?

Есть ли способ заставить NHibernate выдавать подсказку о взаимоблокировке? например, для SQL-сервера «SET DEADLOCK_PRIORITY LOW». В настоящий момент я просто выполняю необработанный SQL-запрос.
вопрос задан: 14 April 2011 05:18
1
ответ

PHP DOMElement getElementsByTagName определенный селектор

$content = file_get_contents (http://www.domain.com/page.html); $dom = новый DOMDocument (); если (! $dom-> loadHTML ($content)), умирают ("Разве, загрузка не могла зарегистрировать?"); $title = $dom-> getElementById ("cssid"); $
вопрос задан: 6 November 2010 16:10
1
ответ

Индийский железнодорожный поиск поезда [закрытый] API

Есть ли любой API, обеспеченный индийскими Железными дорогами для поиска его сети железных дорог, расписания и т.д. Существует много сайтов там, которые показывают расписание и т.д. Я искал Google, но не мог найти информацию в сети...
вопрос задан: 12 August 2010 08:54
1
ответ

BeautifulSoup и ASP.NET/C#

Кто-либо интегрировал BeautifulSoup с ASP.NET/C# (возможно использующий IronPython или иначе)? Есть ли альтернатива BeautifulSoup или порт, который работает приятно с ASP.NET/C# намерение планирования...
вопрос задан: 28 July 2010 20:23
1
ответ

Как превратить веб-калькулятор в вызываемую программу?

На веб-странице есть бесплатный онлайн-калькулятор, доступ к которому я хочу получить из программы на C #. Калькулятор очень прост - просто таблица HTML. Там нет JavaScript или Flash. Я хочу быть в состоянии ...
вопрос задан: 25 July 2010 18:22
1
ответ

Невозможный сайт для HtmlUnit?

Я не могу, ни за что в жизни, подстроить HtmlUnit для захвата этого сайта: http://www.bing.com/travel/flight/flightSearch?form=FORMTRVLGENERIC&q=flights+from+SLC+to+BKK+leave+07%2F30%2F2010+return+08%2F11%...
вопрос задан: 15 July 2010 06:03
1
ответ

Проверка и Очистка App Store iTunes

Я заметил, что предварительный просмотр iTunes позволяет Вам проверять и очищать страницы по протоколу http://. Однако многие ссылки пытаются быть открытыми в iTunes, а не браузере. Например, когда Вы...
вопрос задан: 23 June 2010 01:05
1
ответ

PHP, эквивалентный из PyQuery или Nokogiri? [закрытый]

В основном я хочу сделать некоторый анализ экранных данных HTML, но выясняющий, возможно ли это в PHP. В Python я использовал бы PyQuery. В Ruby я использовал бы Nokogiri.
вопрос задан: 12 May 2010 02:07
1
ответ

Есть ли Python, эквивалентный для Термина модуля Perl:: VT102?

В Perl существует очень удобный модуль, Термин:: VT102, который позволяет Вам создавать экран в памяти. Это очень удобно для очистки целей, так как можно отслеживать все изменения в частях...
вопрос задан: 25 February 2010 19:57
1
ответ

Как я должен использовать HTMLAgilityPack AppendNode?

Страдал от реальной головной боли на данном этапе в пятницу! Я пытаюсь добавить HtmlNode к другому использованию InsertAfter (). Я вижу refChild узел с идентификатором навигационных цепочек, когда я rpint он к консоли, но сохраняю...
вопрос задан: 22 January 2010 15:46
1
ответ

Выберите весь <p> из дочернего использования Узла HTMLAgilityPack

У меня есть следующий код, который я использую для получения страницы HTML. Сделайте URL абсолютными и затем сделайте рэл ссылок nofollow и открытый в новом окне/вкладке. Моя проблема вокруг добавления атрибутов...
вопрос задан: 21 January 2010 17:45