UnicodeDecodeError : кодек 'ascii' не может декодировать

Question

Я читаю файл, содержащий румынские слова на языке Python с помощью file.readline (). У меня проблема со многими символами из-за кодировки.

Пример:

>>> a = "aberație"  #type 'str'
>>> a -> 'abera\xc8\x9bie'
>>> print sys.stdin.encoding
UTF-8

Я пробовал encode () с utf-8, cp500 и т. Д., Но это не сработало.

Я не могу найти Какую кодировку символов я должен использовать?

Заранее спасибо.

Редактировать: Цель состоит в том, чтобы сохранить слово из файла в словаре и при его печати получить aberație, а не 'abera \ xc8 \ x9bie '

8

задан lilawood 30 June 2011 в 21:29

0 ответов

Другие вопросы по тегам: