urllib2.urlopen () по сравнению с urllib.urlopen () - urllib2 бросает 404, в то время как urllib работает! ПОЧЕМУ?

Question

urllib2.urlopen () по сравнению с urllib.urlopen () - urllib2 бросает 404, в то время как urllib работает! ПОЧЕМУ?

import urllib

print urllib.urlopen('http://www.reefgeek.com/equipment/Controllers_&_Monitors/Neptune_Systems_AquaController/Apex_Controller_&_Accessories/').read()

Вышеупомянутый сценарий работает и возвращает ожидаемые результаты в то время как:

import urllib2

print urllib2.urlopen('http://www.reefgeek.com/equipment/Controllers_&_Monitors/Neptune_Systems_AquaController/Apex_Controller_&_Accessories/').read()

броски следующая ошибка:

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/lib/python2.5/urllib2.py", line 124, in urlopen
    return _opener.open(url, data)
  File "/usr/lib/python2.5/urllib2.py", line 387, in open
    response = meth(req, response)
  File "/usr/lib/python2.5/urllib2.py", line 498, in http_response
    'http', request, response, code, msg, hdrs)
  File "/usr/lib/python2.5/urllib2.py", line 425, in error
    return self._call_chain(*args)
  File "/usr/lib/python2.5/urllib2.py", line 360, in _call_chain
    result = func(*args)
  File "/usr/lib/python2.5/urllib2.py", line 506, in http_error_default
    raise HTTPError(req.get_full_url(), code, msg, hdrs, fp)
urllib2.HTTPError: HTTP Error 404: Not Found

Кто-либо знает, почему это? Я выполняю это от ноутбука в моей домашней сети без настроек прокси - просто прямо с моего ноутбука на маршрутизатор тогда к www.

16

python url http-status-code-404 urllib2 urllib

задан 22 December 2009 в 15:34

1 ответ

Другие вопросы по тегам:

python url http-status-code-404 urllib2 urllib

Похожие вопросы:

score 35 · Answer 1

Этот URL действительно приводит к 404, но с большим количеством HTML содержимого. urllib2 обрабатывает его (правильно) как условие ошибки. Вы можете восстановить содержимое страницы 404 этого сайта так:

import urllib2
try:
    print urllib2.urlopen('http://www.reefgeek.com/equipment/Controllers_&_Monitors/Neptune_Systems_AquaController/Apex_Controller_&_Accessories/').read()
except urllib2.HTTPError, e:
    print e.code
    print e.msg
    print e.headers
    print e.fp.read()