Учитывая строку Unicode, я хочу заменить символы, отличные от ASCII, кодом LaTeX, который их создает (например, если é
станет \ 'e
, и œ
становится \ oe
). Я включаю это в код Python. Это должно полагаться на таблицу перевода, и я придумал следующий код, который прост и, кажется, хорошо работает:
accents = [
[ u"à", "\\`a"],
[ u"é", "\\'e"]
]
translation_table = dict([(ord(k), unicode(v)) for k, v in accents])
print u"été à l'eau".translate(translation_table)
Но написание довольно полной таблицы перевода займет у меня много времени, и Google мало чем помог. Есть ли у кого-нибудь такая готовая вещь или знает, где ее найти?
PS: Я новичок в Python, поэтому, конечно, приветствую комментарии к приведенному выше коду.