Python - urllib2.urlopen - Почему я получаю искаженные символы?

Вот моя проблема:

import urllib2

response=urllib2.urlopen('http://proxy-heaven.blogspot.com/')
html=response.read()

print html

Это - просто этот сайт, и я не знаю, почему результатом являются все искаженные символы. Кто-либо может помочь?

1
задан Shane 26 July 2010 в 15:33
поделиться

3 ответа

Без вашего вывода сложно сказать, но готов поспорить, что это проблема с кодировкой: этот веб-сайт закодирован в utf8. Например, если ваш терминал настроен на iso-latin, он не сможет правильно отображать символы.

1
ответ дан 2 September 2019 в 22:45
поделиться

кодировка может быть вашей проблемой, и в этом случае вам нужен этот код.

import urllib
s = str(urllib.urlopen('http://proxy-heaven.blogspot.com/').read(), encoding='utf8')
0
ответ дан 2 September 2019 в 22:45
поделиться

Подходит для меня:

import urllib
response=urllib.urlopen('http://proxy-heaven.blogspot.com/')
a = response.read()
print a[:50]

> '<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Stric'

У вас могут быть проблемы с кодированием в хотя ваш терминал.

1
ответ дан 2 September 2019 в 22:45
поделиться
Другие вопросы по тегам:

Похожие вопросы: