Как обнаружить символы UTF-8 в столбце с кодировкой Latin1 - MySQL

Я собираюсь выполнить утомительную и сложную задачу по преобразованию базы данных из Latin1 в UTF-8.

На этом этапе я просто хочу проверить, какие данные я сохранил в своих таблицах, так как это определит, какой подход я должен использовать для преобразования данных.

В частности, я хочу проверить, есть ли у меня символы UTF-8 в столбцах Latin1. Как лучше всего это сделать? Если затронуты только несколько строк, я могу просто исправить это вручную.

Вариант 1. Выполнить дамп MySQL и использовать Perl для поиска символов UTF-8?

Вариант 2. Использовать MySQL CHAR_LENGTH для поиска строк с многобайтовыми символами? например ВЫБРАТЬ имя ИЗ клиентов, ГДЕ LENGTH (имя)! = CHAR_LENGTH (имя); Этого достаточно?

На данный момент я переключил кодировку моего клиента Mysql на UTF-8.

16
задан dinie 16 February 2012 в 02:03
поделиться