W3C объясняет разбор в форме псевдорежима: W3C Link
Следуйте за ссылками на QName
, S
и Attribute
, чтобы получить более четкое картина. Исходя из этого, вы можете создать довольно хорошее регулярное выражение для обработки таких вещей, как снятие тегов.
return
в последней строке определения функции находится внутри цикла for, поэтому функция вернется на первой итерации, и дальнейшие итерации никогда не произойдут. На самом деле в python вам не нужно писать return в конце функции, по умолчанию будет возвращаться None
.
или измените идентификацию:
def Key_Stats(gather="Total Debt/Equity (mrq)"):
statspath = path+'/_KeyStats'
stock_list = [x[0] for x in os.walk(statspath)]
print(stock_list[1:10])
for each_dir in stock_list[1:]:
print(each_dir)
each_file = os.listdir(each_dir)
ticker = each_dir.split("_KeyStats\\")[1]
if len(each_file) > 0:
#parsing time from the html file
for file in each_file:
date_stamp = time.strptime(file, '%Y%m%d%H%M%S.html')
unix_time = time.mktime(date_stamp)
#print(date_stamp, unix_time)
full_file_path = each_dir+'/'+file
source = open(full_file_path, 'r').read()
value = source.split(gather+':</td><td class="yfnc_tabledata1">')[1].split('</td>')[0]
#print(ticker+":", value)
#time.sleep(15)
return