Я использую Google App Engine и не могу использовать расширение C/C++, просто чистая и pythonic библиотека, чтобы сделать преобразование Unicode/UTF-8 строк к более низкому / верхнему регистру. str.lower () и string.lowercase () не делают.
str
в кодировке UTF-8 и unicode
два разных типа. Не используйте строку
, используйте соответствующий метод на объекте юникода:
>>> print u'ĉ'.upper()
Ĉ
Декодируйте str
до юникода
перед использованием:
>>> print 'ĉ'.decode('utf-8').upper()
Ĉ