0
ответов

Ищу хороший 64-битный хеш для путей к файлам в UTF16

У меня путь в кодировке Unicode / UTF-16. разделитель путей - U + 005C '\'. Пути представляют собой корневые относительные пути файловой системы Windows с завершающим нулем, например "\ windows \ system32 \ drivers \ myDriver32.sys" I ...
вопрос задан: 2 April 2011 00:09
0
ответов

В чем смысл UTF-16?

Я никогда не понимал смысла кодировки UTF-16. Если вам нужно иметь возможность обрабатывать строки как произвольный доступ (т.е. кодовая точка совпадает с кодовой единицей), тогда вам понадобится UTF-32, поскольку UTF-16 все еще ...
вопрос задан: 13 March 2011 20:28
0
ответов

Как было выбрано положение области суррогатов (UTF-16)?

Было ли положение области суррогатов UTF-16 (U + D800..U + DFFF) выбрано случайным образом или у этого есть какая-то логическая причина, что он находится на этом месте?
вопрос задан: 3 March 2011 14:38
0
ответов

Нормализация строки Unicode в C / C ++

Мне интересно, как нормализовать строки (содержащие utf-8 / utf-16) в C / C ++. В .NET есть функция String.Normalize. Раньше я использовал UTF8-CPP, но он не предоставляет такой функции. ICU и ...
вопрос задан: 3 February 2011 10:18
0
ответов

Всегда ли символы UTF16 (используемые, например, функциями wide-winapi) 2 байта?

Пожалуйста, поясните мне, как работает UTF16? Я немного сбит с толку, учитывая эти моменты: в C ++ есть статический тип WCHAR, длина которого составляет 2 байта. (всегда 2 байта, очевидно) Большая часть msdn ...
вопрос задан: 11 January 2011 00:53
0
ответов

Эффективное преобразование двоичного кода в строку (например, base64, но для UTF8 / UTF16)?

У меня много групп двоичных данных в диапазоне от 16 до 4096 байт, которые необходимо сохранить в базе данных и которые должны быть легко сопоставимы как единое целое (например, два пакета пакета данных, только если ...
вопрос задан: 22 October 2010 15:54