Извлечь HTML из URL

Я использую Boilerpipe для извлечения текста из URL, используя следующий код:

URL url = new URL("http://www.example.com/some-location/index.html");
String text = ArticleExtractor.INSTANCE.getText(url);

Строка текст содержит только текст HTML-страницы, но мне нужно извлечь из нее весь html-код.

Есть ли кто-нибудь, кто использовал эту библиотеку и знает, как извлечь HTML-код?

Вы можете проверить демонстрационную страницу для получения дополнительной информации о библиотека.

7
задан Goran Jovic 10 January 2012 в 15:57
поделиться