кодировка XML по умолчанию - UTF-8 или UTF-16?

OpenTag FAQ гласит:

Если нет объявление кодировки присутствует в XML-документе (и никаких внешних механизм объявления кодировки, такой как заголовок HTTP доступен), предполагаемая кодировка XML-документа зависит от наличия Метка порядка байтов (BOM).

BOM - это специальный маркер Unicode. помещается вверху файла, который укажите его кодировку. Спецификация необязательный для UTF-8.

 Первые байты Предполагаемая кодировка
 -----------------------------------------
EF BB BF UTF-8
FE FF UTF-16 (с прямым порядком байтов)
FF FE UTF-16 (с прямым порядком байтов)
00 00 FE FF UTF-32 (с прямым порядком байтов)
FF FE 00 00 UTF-32 (прямой порядок байтов)
Ни один из вышеперечисленных UTF-8
 

Есть ли упрощенное объяснение вышеприведенного абзаца?

17
задан Pacerier 3 January 2013 в 03:08
поделиться