Ошибка с urlencode в Python

У меня есть это:

a = {'album': u'Metamorphine', 'group': 'monoku', 'name': u'Son Of Venus (Danny\xb4s Song)', 'artist': u'Leandra', 'checksum': '2836e33d42baf947e8c8adef48921f2f76fcb37eea9c50b0b59d7651', 'track_number': 8, 'year': '2008', 'genre': 'Darkwave', 'path': u'/media/data/musik/Leandra/2008. Metamorphine/08. Son Of Venus (Danny\xb4s Song).mp3', 'user_email': 'diegueus9@gmail.com', 'size': 6624104}
data = urllib.urlencode(mp3_data)

И то повышение исключение:

Traceback (most recent call last):
  File "playkud.py", line 44, in <module>
    main()
  File "playkud.py", line 29, in main
    craw(args, options.user_email, options.group)
  File "/home/diegueus9/workspace/playku/src/client/playkud/crawler/crawler.py", line 76, in craw
    index(root, file, data, user_email, group)
  File "/home/diegueus9/workspace/playku/src/client/playkud/crawler/crawler.py", line 58, in index
    done = add_song(data[mp3file])
  File "/home/diegueus9/workspace/playku/src/client/playkud/service.py", line 32, in add_song
    return make_request(URL+'add_song/', data)
  File "/home/diegueus9/workspace/playku/src/client/playkud/service.py", line 14, in make_request
    data = urllib.urlencode(dict([k.encode('utf-8'),v] for k,v in mp3_data.items()))
  File "/usr/lib/python2.5/urllib.py", line 1250, in urlencode
    v = quote_plus(str(v))
UnicodeEncodeError: 'ascii' codec can't encode character u'\xb4' in position 19: ordinal not in range(128)

и с ipython (2.5):

In [7]: urllib.urlencode(a)
UnicodeEncodeError                        Traceback (most recent call last)

/home/diegueus9/<ipython console> in <module>()

/usr/lib/python2.5/urllib.pyc in urlencode(query, doseq)
   1248         for k, v in query:
   1249             k = quote_plus(str(k))
-> 1250             v = quote_plus(str(v))
   1251             l.append(k + '=' + v)
   1252     else:

UnicodeEncodeError: 'ascii' codec can't encode character u'\xb4' in position 19: ordinal not in range(128)

Как я могу зафиксировать его?

28
задан NorthCat 16 July 2015 в 15:00
поделиться

3 ответа

Библиотека urlencode ожидает данные в формате str и не очень хорошо работает с данными Unicode, поскольку не предоставляет возможности указать кодировку. Вместо этого попробуйте следующее:

mp3_data = {'album': u'Metamorphine',
     'group': 'monoku',
     'name': u'Son Of Venus (Danny\xb4s Song)',
     'artist': u'Leandra',
     'checksum': '2836e33d42baf947e8c8adef48921f2f76fcb37eea9c50b0b59d7651',
     'track_number': 8,
     'year': '2008', 'genre': 'Darkwave',
     'path': u'/media/data/musik/Leandra/2008. Metamorphine/08. Son Of Venus (Danny\xb4s Song).mp3',
     'user_email': 'diegueus9@gmail.com',
     'size': 6624104}

str_mp3_data = {}
for k, v in mp3_data.iteritems():
    str_mp3_data[k] = unicode(v).encode('utf-8')
data = urllib.urlencode(str_mp3_data)

Я сделал так: перед передачей словаря в функцию urlencode я убедился, что все данные закодированы в str с использованием UTF-8.

58
ответ дан 28 November 2019 в 02:41
поделиться

проблема в том, что вы хотите преобразовать строку Unicode в строку, но есть некоторые символы, которые необходимо сначала преобразовать в ASCII. Поэтому я бы посоветовал вам искать строки, которые не являются ASCII, а затем кодировать их следующим образом:

попробуйте изменить , например, , где v - это строка Unicode, чтобы:

quote_plus(str(v))

-

quote_plus(str(v.encode("utf-8")))

, которые должны помочь


Если вам не нужно использовать Python 2.x, вы можете переключиться на Python 3.x, где все строки по умолчанию являются Unicode. Но для этого вам нужно кое-что преобразовать (вы можете автоматизировать эту вечеринку или полностью с помощью 2to3 ).

3
ответ дан 28 November 2019 в 02:41
поделиться

Проблема в том, что некоторые значения в дикте mp3_data являются строками unicode, которые не могут быть представлены в кодировке по умолчанию, используемой urlencode() (другие - ASCII, а третьи - целые числа). Это можно исправить, закодировав эти значения перед передачей их в urlencode(). В строке 14 файла /home/diegueus9/workspace/playku/src/client/playkud/service.py, в make_request(), попробуйте заменить this:

data = urllib.urlencode(dict([k.encode('utf-8'),v] for k,v in mp3_data.items()))

на this:

data = urllib.urlencode(dict([k.encode('utf-8'),unicode(v).encode('utf-8')] for k,v in mp3_data.items()))
4
ответ дан 28 November 2019 в 02:41
поделиться
Другие вопросы по тегам:

Похожие вопросы: