Я пытаюсь достигнуть диакритического знака и нечувствительной к регистру сортировки в MySQL. Следуя инструкциям в руководстве, это, как предполагается, работает с utf8 набором символов и utf8_general_ci сопоставлением.
Когда я следую примеру в руководстве (http://dev.mysql.com/doc/refman/5.1/en/charset-collation-implementations.html) при "Сопоставлениях для многобайтовых наборов символов Unicode", я не получаю те же результаты:
Welcome to the MySQL monitor. Commands end with ; or \g.
Your MySQL connection id is 679877
Server version: 5.1.41-log MySQL Community Server (GPL) by Remi
Type 'help;' or '\h' for help. Type '\c' to clear the current input statement.
mysql> SET NAMES 'utf8' COLLATE 'utf8_general_ci';
Query OK, 0 rows affected (0.00 sec)
mysql> SELECT 'a' = 'A', 'a' = 'À', 'a' = 'á';
+-----------+-----------+-----------+
| 'a' = 'A' | 'a' = 'À' | 'a' = 'á' |
+-----------+-----------+-----------+
| 1 | 0 | 0 |
+-----------+-----------+-----------+
1 row in set (0.00 sec)
mysql>
В примере в руководстве это - весь 1.
Этому также не удается рассматривать символы с диакритикой одинаково, когда я пытаюсь установить сопоставление непосредственно в запросе. В этом примере таблица использует latin1, и я преобразовываю в utf8.
mysql> select * from test;
+----------+
| k |
+----------+
| Cárdenas |
| Cardozo |
| Corbin |
| Cabrero |
+----------+
mysql> select k from test order by convert(k using utf8) collate utf8_general_ci
;
+----------+
| k |
+----------+
| Cabrero |
| Cardozo |
| Corbin |
| Cárdenas |
+----------+
4 rows in set (0.00 sec)
Это должно игнорировать диакритический знак по в последней записи и сортировать его второй. Какие-либо идеи, что я делаю неправильно?
Мне здесь что-то не хватает ... но нельзя просто создать функцию (скажем, removeAccents
), которая принимает строку и возвращает эквивалентную строку без акцента, а затем сортирует автор removeAccents (поле)
. Я считаю, что вы также можете создать индекс для этого, что должно помочь с производительностью.
Он работает с моей установкой MySQL по умолчанию. Поскольку вы не предоставили SHOW FULL COLUMNS из теста (комментарий @fsb), все еще возможно, что сопоставление в вашей структуре таблицы неверно.
Установлено ли для сортировки столбца «k» значение, отличное от utf8_general_ci?
Проверить, дает ли SELECT k from Names ORDER BY k ASC правильный ответ
Был ли изменен файл Index.xml установки MySQL чтобы изменить значение utf8_general_ci?
Соответствующая часть моей установки для сравнения:
<charset name="utf8">
<family>Unicode</family>
<description>UTF-8 Unicode</description>
<alias>utf-8</alias>
<collation name="utf8_general_ci" id="33">
<flag>primary</flag>
<flag>compiled</flag>
</collation>
<collation name="utf8_bin" id="83">
<flag>binary</flag>
<flag>compiled</flag>
</collation>
</charset>
Возможно, кто-то другой изменил одну из этих вещей для какой-то гнусной цели ...
{ {1}}