В latin1 длина каждого символа составляет ровно один байт. В utf8 символ может состоять из более чем одного байта. Следовательно, utf8 имеет больше символов, чем latin1 (и символы, которые у них есть общие, не обязательно представлены одной и той же байтовой / байтовой последовательностью).
UTF-8 подготовлен к мировому господству, Latin1 нет.
Если вы пытаетесь сохранить нелатинские символы, такие как китайский, японский, иврит, русский и т. Д., Используя кодировку Latin1, они будут иметь вид mojibake . Вы можете найти вводный текст этой статьи полезным (и даже больше, если вы немного знаете Java).
Обратите внимание, что полная поддержка 4-байтового UTF-8 была введена только в MySQL 5.5. До этой версии он занимал до 3 байтов на символ, а не 4 байта на символ. Таким образом, он поддерживал только самолет БМП, а не например. самолет Emoji. Если вам нужна полная поддержка 4-байтового UTF-8, обновите MySQL до версии не ниже 5.5 или перейдите на другую СУБД, например PostgreSQL. В MySQL 5.5+ он называется utf8mb4
.