Я пишу Java-код, который имеет дело с китайскими иероглифами, и я получил некоторые неожиданные результаты - строки, которые должны быть равны, не были. Вот один из оскорбительных символов, что означает «шесть» (пиньинь: liù): 六. Этот символ может быть представлен любой из двух кодовых точек:
F9D1 в блоке: CJK Compatibility Ideographs
516D в блоке: CJK Unified Ideographs
В Википедии есть страницаоб этих диапазонах символов, а в коротком разделе об идеографах совместимости упоминаются некоторые дубликаты, но в списке этот конкретный символ опущен.
Поэтому мне интересно: