Преобразование Java в UTF-8 в ASCII с дополнениями

мы принимаем всевозможные национальные символы в строке UTF-8 на входе, и нам нужно преобразовать их в строку ASCII на выходе для некоторого устаревшего использования. ( мы не принимаем китайские и японские символы,

Бозо

10
задан bozo 30 March 2010 в 12:43
поделиться

2 ответа

Есть какой-нибудь простой способ сделать это без миллиона вызовов .replaceAll ()?

Если вы просто поддерживаете европейские языки на основе латиницы, около 100 должно хватить; это определенно выполнимо: возьмите диаграммы Unicode для Latin-1 Supplement и Latin Extended-A и запустите вечеринку String.replace . : -)

0
ответ дан 4 December 2019 в 04:01
поделиться

Вы хотите использовать ICU4J. Он включает класс com.ibm.icu.text.Transliterator, который, очевидно, может делать то, что вы ищете.

2
ответ дан 4 December 2019 в 04:01
поделиться
Другие вопросы по тегам:

Похожие вопросы: