Различия между utf8 и latin1

каково различие между utf8 и latin1?

118
задан binbash 25 April 2010 в 16:38
поделиться

2 ответа

В latin1 длина каждого символа составляет ровно один байт. В utf8 символ может состоять из более чем одного байта. Следовательно, utf8 имеет больше символов, чем latin1 (и символы, которые у них есть общие, не обязательно представлены одной и той же байтовой / байтовой последовательностью).

41
ответ дан 24 November 2019 в 01:59
поделиться

UTF-8 подготовлен к мировому господству, Latin1 нет.

Если вы пытаетесь сохранить нелатинские символы, такие как китайский, японский, иврит, русский и т. Д., Используя кодировку Latin1, они будут иметь вид mojibake . Вы можете найти вводный текст этой статьи полезным (и даже больше, если вы немного знаете Java).

Обратите внимание, что полная поддержка 4-байтового UTF-8 была введена только в MySQL 5.5. До этой версии он занимал до 3 байтов на символ, а не 4 байта на символ. Таким образом, он поддерживал только самолет БМП, а не например. самолет Emoji. Если вам нужна полная поддержка 4-байтового UTF-8, обновите MySQL до версии не ниже 5.5 или перейдите на другую СУБД, например PostgreSQL. В MySQL 5.5+ он называется utf8mb4 .

145
ответ дан 24 November 2019 в 01:59
поделиться
Другие вопросы по тегам:

Похожие вопросы: