Если я понимаю правильно, UTF-32 может обработать каждый символ во вселенной. Так может UTF-16, с помощью суррогатных пар. Так есть ли какое-либо серьезное основание использовать UTF-32 вместо UTF-16?
Я имею дело с кодом, который делает различные операции IO с файлами, и я хочу сделать способным иметь дело с международными именами файлов. Я работаю над Mac с Java 1.5, и если имя файла содержит...
I was reading the documentation for StringBuffer, in particular the reverse() method. That documentation mentions something about surrogate pairs. What is a surrogate pair in this context? And what ...
BMP являются базовой многоязычной плоскостью Согласно JavaScript: хорошие части: JavaScript был создан в то время, когда Unicode был 16-битным набором символов, поэтому все символы в JavaScript имеют ширину 16 бит ....
По вашему опыту, какие символы Unicode, кодовые точки и диапазоны за пределами BMP (базовой многоязычной плоскости) являются наиболее распространенными на данный момент? Это те, которые требуют 4 байта в UTF-8 или суррогатах ...
Я работаю со строками, которые могут содержать суррогатные символы Юникода (не BMP, 4 байта на символ). Когда я использую формат "\Uxxxxxxxxv" для указания суррогатного символа в F# - для некоторых...