python UnicodeEncodeError> Как я могу просто удалить вызывающие беспокойство символы Unicode?

Вот что я сделал ..

>>> soup = BeautifulSoup (html)
>>> soup
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'ascii' codec can't encode character u'\xae' in position 96953: ordinal not in range(128)
>>> 
>>> soup.find('div')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'ascii' codec can't encode character u'\xae' in position 11035: ordinal not in range(128)
>>> 
>>> soup.find('span')
<span id="navLogoPrimary" class="navSprite"><span>amazon.com</span></span>
>>> 

Как я могу просто удалить вызывающие беспокойство символы Unicode из html ?
Или есть какое-нибудь более чистое решение?

6
задан Nullpoet 8 March 2011 в 18:04
поделиться