Jsoup загружает частичную страницу

Question

Jsoup загружает частичную страницу

Я пытаюсь очистить содержимое веб-сайтов, предлагающих ставки, но не могу получить полную страницу веб-сайта. Я использую лом на xulrunner, чтобы сначала получить страницу (поскольку ajax загружает определенные элементы лениво), а затем очистить файл. Но на главной странице сайта Bidrivals это не удается, даже если локальный файл сформирован правильно. Кажется, что jSoup заканчивается символами «...» в середине html-кода. Если кто сталкивался с этим раньше, помогите пожалуйста. Следующий код вызывается для [ этой ссылки ].

File f = new File(projectLocation+logFile+"bidrivalsHome");
    try {
        f.createNewFile();
        log.warn("Trying to fetch mainpage through a console.");
        WinRedirect.redirect(projectLocation+"Curl.exe -s --data \"url="+website+"&delay="+timeDelay+"\" http://127.0.0.1:10000", projectLocation, logFile+"bidrivalsHome");
    } catch (Exception e) {
        e.printStackTrace();
        log.warn("Error in fetching the nameList", e);
    }
    Document doc = new Document("");
    try {
        doc = Jsoup.parse(f, "UTF-8", website);
    } catch (IOException e1) {
        System.out.println("Error while parsing the document.");
        e1.printStackTrace();
        log.warn("Error in parsing homepage", e1);
    }

8

java web-scraping jsoup

задан Debosmit Ray 11 April 2016 в 23:34

0 ответов

Другие вопросы по тегам:

java web-scraping jsoup

Jsoup загружает частичную страницу

0 ответов

Похожие вопросы: