Записать PDF-файл из URL-адреса с помощью urllib2

Question

Записать PDF-файл из URL-адреса с помощью urllib2

Я пытаюсь сохранить динамический файл PDF, созданный с веб-сервера с использованием модуля urllib2 Python. Я использую следующий код для получения данных с сервера и записи этих данных в файл, чтобы сохранить PDF-файл на локальном диске: [

import urllib2
import cookielib

theurl = 'https://myweb.com/?pdf&var1=1'
cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
opener.addheaders.append(('Cookie', cookie))
request = urllib2.Request(theurl)

print("... Sending HTTP GET to %s" % theurl)
f = opener.open(request)
data = f.read()
f.close()
opener.close()

FILE = open('report.pdf', "w")
FILE.write(data)
FILE.close()

] Этот код работает хорошо, но записанный PDF-файл плохо распознается Adobe Reader. Если я сделаю запрос вручную с помощью firefox, у меня не будет проблем с получением файла, и я могу визуализировать его без проблем. Сравнивая полученные заголовки http (firefox и urrlib), единственное различие - это поле заголовка http с названием «Transfer-Encoding = chunked». Это поле получено в firefox, но кажется, что оно не получено, когда я выполняю запрос urllib. Any suggestion?

11

python urllib2

задан Seanog 11 October 2012 в 09:15

0 ответов

Другие вопросы по тегам:

python urllib2

Записать PDF-файл из URL-адреса с помощью urllib2

0 ответов

Похожие вопросы: