Вот моя проблема:
import urllib2
response=urllib2.urlopen('http://proxy-heaven.blogspot.com/')
html=response.read()
print html
Это - просто этот сайт, и я не знаю, почему результатом являются все искаженные символы. Кто-либо может помочь?
Без вашего вывода сложно сказать, но готов поспорить, что это проблема с кодировкой: этот веб-сайт закодирован в utf8. Например, если ваш терминал настроен на iso-latin, он не сможет правильно отображать символы.
кодировка может быть вашей проблемой, и в этом случае вам нужен этот код.
import urllib
s = str(urllib.urlopen('http://proxy-heaven.blogspot.com/').read(), encoding='utf8')
Подходит для меня:
import urllib
response=urllib.urlopen('http://proxy-heaven.blogspot.com/')
a = response.read()
print a[:50]
> '<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Stric'
У вас могут быть проблемы с кодированием в хотя ваш терминал.