Очистка данных, сгенерированных javascript, с помощью Python

Я хочу очистить некоторые данные следующего URL-адреса с помощью Python. http://www.hankyung.com/stockplus/main.php?module=stock&mode=stock_analysis_infomation&itemcode=078340

Это краткое изложение информации о компании.

То, что я хочу очистить, не отображается на первой странице. Нажав на вкладку «재무제표», вы можете получить доступ к финансовой отчетности. И, щелкнув вкладку «현금흐름표», вы можете получить доступ к «Денежному потоку».

Я хочу очистить данные «Денежный поток».

Однако данные о денежном потоке генерируются с помощью javascript через URL-адрес. Следующая ссылка является скрытым URL-адресом: http://stock.kisline.com/compinfo/financial/main.action?vhead=N&vfoot=N&vstay=&omit=&vwidth=

Данные о движении денежных средств генерируются отправив некоторое значение параметра и файл cookie на этот URL-адрес.

Как вы поняли, itemcode=078340 в первой ссылке означает код акции, и существует целых 1680 акций, по которым я хочу собирать данные о движении денежных средств. Я хочу сделать это структурой цикла.

Есть ли хороший способ очистить данные о денежных потоках? Я пробовал скрапить, но скрейпу трудно справиться с моим другим кодом очистки, который я уже использую.

8
задан trigger 7 April 2012 в 10:06
поделиться