HTML царапанья сгенерирован JavaScript с Python

Я должен выскоблить сайт Python. Я получаю исходный HTML-код с urlib модулем, но я должен очистить также некоторый HTML-код, который сгенерирован функцией JavaScript (который включен в источник HTML). То, что это функционирует, делает "в" сайте, то, что при нажатии кнопки, она производит некоторый HTML-код. Как я могу "нажать" эту кнопку с кодом Python? Может пестрый помогать мне? Я получил запрос POST с поджигателем, но когда я пытаюсь передать его URL, я получаю 403 ошибки. Какие-либо предложения?

17
задан hymloth 24 November 2011 в 09:56
поделиться

1 ответ

Мне приходилось сделать это раньше (в .NET), и вы в основном собираетесь придержать браузер, получите его, чтобы нажать кнопку, а затем допросить DOM (модель объекта документа ) браузера, чтобы получить сгенерированный HTML.

Это определенно один из DownSides для веб-приложений, движущихся в направлении подхода AJAX / JavaScript для создания HTML-клиентской стороны.

4
ответ дан 30 November 2019 в 12:50
поделиться
Другие вопросы по тегам:

Похожие вопросы: