Не чувствительная к диакритическим знакам сортировка в MySQL

Я пытаюсь достигнуть диакритического знака и нечувствительной к регистру сортировки в MySQL. Следуя инструкциям в руководстве, это, как предполагается, работает с utf8 набором символов и utf8_general_ci сопоставлением.

Когда я следую примеру в руководстве (http://dev.mysql.com/doc/refman/5.1/en/charset-collation-implementations.html) при "Сопоставлениях для многобайтовых наборов символов Unicode", я не получаю те же результаты:

Welcome to the MySQL monitor.  Commands end with ; or \g.
Your MySQL connection id is 679877
Server version: 5.1.41-log MySQL Community Server (GPL) by Remi

Type 'help;' or '\h' for help. Type '\c' to clear the current input statement.

mysql> SET NAMES 'utf8' COLLATE 'utf8_general_ci';
Query OK, 0 rows affected (0.00 sec)

mysql> SELECT 'a' = 'A', 'a' = 'À', 'a' = 'á';
+-----------+-----------+-----------+
| 'a' = 'A' | 'a' = 'À' | 'a' = 'á' |
+-----------+-----------+-----------+
|         1 |         0 |         0 |
+-----------+-----------+-----------+
1 row in set (0.00 sec)

mysql> 

В примере в руководстве это - весь 1.

Этому также не удается рассматривать символы с диакритикой одинаково, когда я пытаюсь установить сопоставление непосредственно в запросе. В этом примере таблица использует latin1, и я преобразовываю в utf8.

mysql> select * from test;
+----------+
| k        |
+----------+
| Cárdenas |
| Cardozo  |
| Corbin   |
| Cabrero  |
+----------+

mysql> select k from test order by convert(k using utf8) collate utf8_general_ci
;
+----------+
| k        |
+----------+
| Cabrero  |
| Cardozo  |
| Corbin   |
| Cárdenas |
+----------+
4 rows in set (0.00 sec)

Это должно игнорировать диакритический знак по в последней записи и сортировать его второй. Какие-либо идеи, что я делаю неправильно?

11
задан Lee 5 March 2010 в 18:17
поделиться

2 ответа

Мне здесь что-то не хватает ... но нельзя просто создать функцию (скажем, removeAccents ), которая принимает строку и возвращает эквивалентную строку без акцента, а затем сортирует автор removeAccents (поле) . Я считаю, что вы также можете создать индекс для этого, что должно помочь с производительностью.

0
ответ дан 3 December 2019 в 12:17
поделиться

Он работает с моей установкой MySQL по умолчанию. Поскольку вы не предоставили SHOW FULL COLUMNS из теста (комментарий @fsb), все еще возможно, что сопоставление в вашей структуре таблицы неверно.

  • Установлено ли для сортировки столбца «k» значение, отличное от utf8_general_ci?

  • Проверить, дает ли SELECT k from Names ORDER BY k ASC правильный ответ

  • Был ли изменен файл Index.xml установки MySQL чтобы изменить значение utf8_general_ci?

Соответствующая часть моей установки для сравнения:

<charset name="utf8">
  <family>Unicode</family> 
  <description>UTF-8 Unicode</description> 
  <alias>utf-8</alias> 
  <collation name="utf8_general_ci" id="33">
    <flag>primary</flag> 
    <flag>compiled</flag> 
  </collation>
  <collation name="utf8_bin" id="83">
    <flag>binary</flag> 
    <flag>compiled</flag> 
  </collation>
 </charset>
  • Был ли изменен скомпилированный код, чтобы изменить значение utf8_general_ci?

Возможно, кто-то другой изменил одну из этих вещей для какой-то гнусной цели ...

{ {1}}
2
ответ дан 3 December 2019 в 12:17
поделиться
Другие вопросы по тегам:

Похожие вопросы: