Хранение без учета регистра и совместимость с Unicode

После того, как я услышал, что кто-то на моей работе использовал String.toLowerCase () для хранения нечувствительных к регистру кодов в базе данных для возможности поиска, у меня был эпический момент неудачи , когда я думал о количестве способов, которые могут пойти не так:

  • Тест Турции (в частности, изменение локали на работающем компьютере)
  • Обновление версии Unicode - я имею в виду, кто знает об этом? Если я обновлюсь до Java 7, мне придется переиндексировать свои данные, если я не учитываю регистр?

На какие технологии влияют версии Unicode?

Нужно ли мне беспокоиться о том, что Oracle или SQL Server (или другие поставщики) изменят свои версии Unicode, что приведет к тому, что одна из моих локалей не приведет к одинаковому преобразованию нижних или верхних символов?

Как мне это сделать? Меня соблазняет «простота» использования преобразования базы данных, но при обновлении возникнут проблемы того же типа.

15
задан Anish Gupta 17 July 2012 в 10:25
поделиться