Открытие соединения с Jsoup, получение кода состояния и анализ документа.

Я создаю класс с помощью jsoup, который будет делать следующее:

  1. Конструктор открывает соединение с URL-адресом.
  2. У меня есть метод, который будет проверять статус страницы. т.е. 200, 404 и т.д.
  3. У меня есть метод анализа страницы и возврата списка URL-адресов.#

Ниже приведена примерная работа того, что я пытаюсь сделать, не очень грубо, как я делал раньше. пробуя много разных вещей

public class ParsePage {
private String path;
Connection.Response response = null;

private ParsePage(String langLocale){
    try {
        response = Jsoup.connect(path)
                .userAgent("Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/535.21 (KHTML, like Gecko) Chrome/19.0.1042.0 Safari/535.21")
                .timeout(10000)
                .execute();
    } catch (IOException e) {
        System.out.println("io - "+e);
    }
}

public int getSitemapStatus(){
    int statusCode = response.statusCode();
    return statusCode;
}

public ArrayList<String> getUrls(){
    ArrayList<String> urls = new ArrayList<String>();

 }
}

Как видите, я могу получить статус страницы, но используя уже открытое соединение из конструктора, я не знаю, как получить документ для разбора, я попытался использовать:

Document doc = connection.get();

Но это не пойдет. Какие-либо предложения? Или лучше сделать это?

7
задан Peck3277 9 May 2012 в 15:14
поделиться