Как извлечь данные из веб-сайта с помощью Java?

Question

Как извлечь данные из веб-сайта с помощью Java?

Я знаком с языком программирования Java, мне нравится извлекать данные из веб-сайта и хранить их к моей базе данных, работающей на моей машине. Это возможное в Java. Раз так, который API я должен использовать. Например, число школ перечислено на веб-сайте, Как я могу извлечь те данные и сохранить их к моей базе данных с помощью Java.

6

java screen-scraping

задан Jherico 11 January 2010 в 19:43

4 ответа

В зависимости от того, что вы действительно пытаетесь сделать, вы можете использовать много разных решений.

Если вы всегда хотите получить HTML-код веб-страницы, то URL.GetContent () может быть вашим решением. Вот небольшое руководство:

http://www.javacoffeebreak.com/books/extracts/javanotesv3/c10/s4.html

Редактировать: не понял, что он искал способ разбора HTML-кода Отказ Некоторые инструменты были предложены выше. Простите за это.

0

ответ дан 10 December 2019 в 02:48

Вам определенно нужен хороший анализатор, такой как неихтмл.

Вот пример использования NekoHTML, хотя и используя Groovy (язык сценариев на основе Java), а не сама Java:

http://www.keplarllp.com/blog/2010/01/better-comeptitome-intelligence --вступление со счету со стоной

1

ответ дан 10 December 2019 в 02:48

Вы можете использовать VietSpider XML из

http://sourceforge.net/projects/binhgiang/files/

Загрузите VietSpider3_16_XML_Windows.zip или VietSpider3_16_XML_Linux.zip

VietSpider Web Data Extractor: Программное обеспечение сканирует данные из веб-сайты ((Data Scraper)) форматируются в стандарте XML (Text, CDATA), а затем сохраняются в реляционной базе данных. Продукт поддерживает различные RDBM, такие как Oracle, MySQL, SQL Server, H2, HSQL, Apache Derby, Postgres ... VietSpider Crawler поддерживает сеанс (вход в систему, ввод запроса по форме), множественную загрузку, обработку JavaScript, прокси (и мульти-прокси). путем автоматического сканирования прокси с веб-сайта)…

1

ответ дан 10 December 2019 в 02:48

Другие вопросы по тегам:

java screen-scraping

Как извлечь данные из веб-сайта с помощью Java?

4 ответа

Похожие вопросы: