Каков надлежащий технический термин для “высокого ASCII” символы?

Question

Каков надлежащий технический термин для “высокого ASCII” символы?

Google Maps и Google Earth используют что-то известное как KML, или "Язык разметки Замочной скважины", который является специальным вариантом XML. Это называют в дани первым спутникам геоотслеживания. Можно хранить информацию на местоположении в Google Earth (и это будет возможная струйка вниз к Google Maps) при помощи этой разметки для геокодирования ее определенных координат широты и долготы. Можно даже включать высоту.

5

character-encoding terminology ascii character extended-ascii

задан Josh Lee 27 December 2009 в 19:36

7 ответов

Коды символов ASCII, превышающие 127, не определены. многие поставщики оборудования и программного обеспечения разработали свой собственный набор символов для значений 128–255. Некоторые выбирают символы рисования, одни выбирают символы с ударением, другие выбирают другие символы.

Юникод - это попытка создать универсальный набор кодов символов, который включает символы, используемые в большинстве языков. Сюда входят не только традиционные западные алфавиты, но и кириллица, арабский, греческий и даже большой набор символов китайского, японского и корейского языков, а также многих других языков, как современных, так и древних.

Есть несколько реализаций Unicode. Один из самых популярных, если UTF-8. Основная причина такой популярности заключается в том, что он обратно совместим с ASCII, коды символов от 0 до 127 одинаковы для ASCII и UTF-8.

Это означает, что лучше сказать, что ASCII является подмножеством UTF-8. Символы с кодом 128 и выше не являются ASCII. Они могут быть в кодировке UTF-8 (или другом Unicode) или могут быть индивидуализированной реализацией поставщиком оборудования или программного обеспечения.

2

ответ дан 18 December 2019 в 09:08

Вы могли бы ввести такие термины, как «trans-ASCII», «supra-ASCII», «ультра-ASCII» и т. Д. На самом деле, «meta-ASCII» был бы даже лучше, поскольку он ссылается на мета-бит.

1

ответ дан 18 December 2019 в 09:08

Битовая последовательность, которая не представляет символ ASCII, не является окончательно символом Unicode.

В зависимости от используемой кодировки символов это может быть:

недопустимая последовательность битов
символ Unicode
символ ISO-8859-x
символ Microsoft 1252
символ в какой-то другой кодировке
ошибка, двоичные данные и т. д.

Единственное определение, которое подходит для всех этих ситуаций:

Не символ ASCII

Чтобы быть очень педантичным, даже " «не-ASCII-символ» точно не подходил бы для всех этих ситуаций, потому что иногда битовая последовательность за пределами этого диапазона может быть просто недопустимой битовой последовательностью, а не символом вообще.

0

ответ дан 18 December 2019 в 09:08

"Extended ASCII" is the term I'd use, meaning "characters beyond the original 0-127".

Unicode is one possible set of Extended ASCII characters, and is quite, quite large.

UTF-8 is the way to represent Unicode characters that is backwards-compatible with the original ASCII.

0

ответ дан 18 December 2019 в 09:08

Non-ASCII Unicode characters.

-1

ответ дан 18 December 2019 в 09:08

Если вы говорите «Высокий ASCII», вы по определению находитесь в диапазоне от 128 до 255 десятичных знаков. Сам ASCII определяется как однобайтовое (фактически 7-битное) символьное представление; использование старшего бита для допуска неанглийских символов произошло позже и привело к кодовым страницам, которые определяли определенные символы, представленные конкретными значениями. Любой многобайтный (> 255 десятичных значений) не является ASCII.

-1

ответ дан 18 December 2019 в 09:08

Другие вопросы по тегам:

character-encoding terminology ascii character extended-ascii

Каков надлежащий технический термин для “высокого ASCII” символы?

7 ответов

Похожие вопросы: