Рекурсивно загружайте страницы XML, используя ссылку href с Python [закрыто]

Question

Рекурсивно загружайте страницы XML, используя ссылку href с Python [закрыто]

Вы также можете использовать метод compareTo() для сравнения двух строк. Если результат compareTo равен 0, то две строки равны, в противном случае сравниваемые строки не равны.

== сравнивает ссылки и не сравнивает фактические строки. Если вы создали каждую строку, используя new String(somestring).intern(), вы можете использовать оператор == для сравнения двух строк, в противном случае могут использоваться только методы equals () или compareTo.

0

xml python-3.x web-scraping download

задан Laveena 9 March 2019 в 23:44

1 ответ

Другие вопросы по тегам:

xml python-3.x web-scraping download

Похожие вопросы:

score 0 · Answer 1

Вы можете собирать, получать доступ или делать все, что захотите, с помощью ссылки, полученной на последующих страницах, используя следующий код:

import xml.etree.ElementTree as ET
import os
import requests
from requests.auth import HTTPBasicAuth

def iterate_xml_automate(link):
#Parent page parsing
all_href = []
all_href.append(link)
tree = ET.fromstring(requests.get(link,
                     auth= HTTPBasicAuth('login', 'Password')).text.encode('utf-8'))   # Parser object
#accessing href component from the XML tree
href = [link.attrib['href'] for link in tree.iter('link')]
all_href.append(href) 
#Run the while loop till you find a href element in the successive xml file
while (len(href)!= 0):
    tree_1 = ET.fromstring(requests.get(str(href[0]),
                                      auth=HTTPBasicAuth('login', 'Password')).text.encode('utf-8'))
    #Update href for accessing next xml link
    href = [link.attrib['href'] for link in tree_1.iter('link')]
    all_href.appned(href)

#Returns all the href from subsequent pages
return href