Как разобрать этот HTML с помощью Jsoup

Question

Как разобрать этот HTML с помощью Jsoup

Я пытаюсь извлечь «Знай свой трактор» и «Shell Petroleum Company.1955»? Имейте в виду, что это всего лишь фрагмент всего кода, а тегов H2/H3 больше, чем один. И я хотел бы чтобы получить данные из всех тегов H2 и H3.

Вот HTML: h ttp://i.stack.imgur.com/Pif3B.png

Код, который у меня только что есть:

    ArrayList arrayList  = new ArrayList();
    Document doc = null;
 try{

     doc = Jsoup.connect("http://primo.abdn.ac.uk:1701/primo_library/libweb/action/search.do?dscnt=0&scp.scps=scope%3A%28ALL%29&frbg=&tab=default_tab&dstmp=1332103973502&srt=rank&ct=search&mode=Basic&dum=true&indx=1&tb=t&vl(freeText0)=tractor&fn=search&vid=ABN_VU1").get();
     Elements heading = doc.select("h2.EXLResultTitle span"); 

     for (Element src : heading) {
            String j = src.text();
            System.out.println(j);  //check whats going into the array 
            arrayList.add(j);
     }

Как мне извлечь «Знай свой трактор» и «Shell Petroleum Company.1955»? Спасибо за вашу помощь!

5

html java jsoup

задан Andrew Thompson 18 March 2012 в 22:35

0 ответов

Другие вопросы по тегам:

html java jsoup

Как разобрать этот HTML с помощью Jsoup

0 ответов

Похожие вопросы: