Селен + питон + Google Диск

W3C объясняет разбор в форме псевдорежима: W3C Link

Следуйте за ссылками на QName, S и Attribute, чтобы получить более четкое картина. Исходя из этого, вы можете создать довольно хорошее регулярное выражение для обработки таких вещей, как снятие тегов.

0
задан Martin Coria 27 February 2019 в 12:37
поделиться

1 ответ

Вы можете установить каталог по умолчанию для загрузки файлов при инициализации хромедрайвера:

import os
from selenium import webdriver
# Set the target subfolder based on the current working directory
dl_folder = '/downloads'
dl_location = os.path.join(os.getcwd(), dl_folder)

# Add the headless argument
chrome_options.add_argument('headless')

# Prepare a dict with additional preferences. This is where the magic happens:
prefs = {"download.default_directory": dl_location}
chrome_options.add_experimental_option("prefs", prefs)

# launch the driver
driver = webdriver.Chrome(executable_path= '/path/to/executable', chrome_options= chrome_options)

После этого вы нажимаете что-то, что инициализирует загрузку

exportbtn = driver.find_element_by_id('exporter-csv')
exportbtn.click()

И затем вы получаете самую последнюю добавлен файл из папки. Например, если это CSV, загрузите его в фрейм данных:

import glob
import pandas as pd
list_of_files = glob.glob(dl_location+ '/*')
latest_file = max(list_of_files, key=os.path.getctime)
df = pd.read_csv(latest_file)

Я не знаю, как напрямую получить имя файла или файл. Если есть что-то, мне любопытно услышать об этом.

0
ответ дан BramV 27 February 2019 в 12:37
поделиться
Другие вопросы по тегам:

Похожие вопросы: