Как GB18030 отличается от Unicode?

Просто укажите тип вашей переменной как IndexPath, так как это тип, который вам нужно сохранить (вы не хотите сохранять число)

var indexPath: IndexPath
12
задан Jonathan Leffler 21 October 2008 в 20:24
поделиться

2 ответа

Согласно статье Wikipedia о GB18030, "GB18030 может быть считаться Форматом преобразования Unicode (т.е. кодирование всех кодовых точек Unicode), который поддерживает совместимость с набором символов прежней версии". Таким образом, все символы Unicode могут быть закодированы в GB18030, но они будут закодированы различными последовательностями байта, чем было бы сгенерировано с UTF-8 или UTF-16. Обработка кодирования GB18030 больше не требует специальных методов, чем требуется для какого-либо другого кодирования не-Unicode.

Проект ICU является библиотекой с открытым исходным кодом (для C или Java), который имеет полную поддержку многой различной кодировки, включая GB18030. Информация о преобразовании между различной кодировкой с ICU может быть найдена здесь.

15
ответ дан 2 December 2019 в 05:28
поделиться

Какие специальные методы требуются для обработки GB18030?

Самое важное, о чем нужно знать, это то, что, в отличие от UTF-8, GB18030 позволяет байтам ASCII встречаться в кодировке мульти- байтовый символ. (Например, 'ß' кодируется как байты 81 30 89 38 , которые содержат кодировку ASCII '0' и '8'.) Это означает, что вы можете ' t использовать простую байтовую функцию find / index .

13
ответ дан 2 December 2019 в 05:28
поделиться
Другие вопросы по тегам:

Похожие вопросы: