Очистка и печать всех имен и тегов в сети на основе определенных тегов

from datetime import datetime, timedelta
from dateutil import parser
def getDateRange(begin, end):
    """  """
    beginDate = parser.parse(begin)
    endDate =  parser.parse(end)
    delta = endDate-beginDate
    numdays = delta.days + 1
    dayList = [datetime.strftime(beginDate + timedelta(days=x), '%Y%m%d') for x in range(0, numdays)]
    return dayList
-2
задан Gallaecio 21 March 2019 в 15:48
поделиться

1 ответ

Я думаю, что лучшим способом было бы использовать xpath. Вы можете использовать библиотеку lxml.

import lxml.html
import lxml.etree

def html_to_root(html):
    html_parser = lxml.etree.HTMLParser(encoding='utf-8')
    return lxml.etree.HTML(html, parser=html_parser)

 html_tree = html_to_root(resp.content)

 division_you_want = html_tree.xpath('xpath')
0
ответ дан Gabriel Soares 21 March 2019 в 15:48
поделиться
Другие вопросы по тегам:

Похожие вопросы: