Regexbuddy делает все это. http://www.regexbuddy.com/
Метод getcode () (добавлен в python2.6) возвращает код состояния HTTP, который был отправлен с ответом, или None, если URL-адрес не является URL-адресом HTTP.
>>> a=urllib.urlopen('http://www.google.com/asdfsf')
>>> a.getcode()
404
>>> a=urllib.urlopen('http://www.google.com/')
>>> a.getcode()
200
Вы также можете использовать urllib2 :
import urllib2
req = urllib2.Request('http://www.python.org/fish.html')
try:
resp = urllib2.urlopen(req)
except urllib2.HTTPError as e:
if e.code == 404:
# do something...
else:
# ...
except urllib2.URLError as e:
# Not an HTTP-specific error (e.g. connection refused)
# ...
else:
# 200
body = resp.read()
Обратите внимание, что HTTPError
является подклассом URLError
, в котором хранится код состояния HTTP.