Японский код ASCII

Нет никакого различия - bool, просто псевдоним Системы. Булевская переменная.

http://msdn.microsoft.com/en-us/library/c8f5xwh7 (По сравнению с 71) .aspx

5
задан dda 23 May 2013 в 09:19
поделиться

4 ответа

ASCII обозначает американский стандартный код для обмена информацией, включает только 128 символов (не все из них даже можно распечатать) и основан на потребностях американского использования примерно в 1960 году. Он включает ничего не связано с японскими символами.

Я считаю, что вам нужны кодовые точки Unicode для некоторых символов, которые вы можете найти в диаграммах , предоставленных unicode.org.

11
ответ дан 18 December 2019 в 09:50
поделиться

См. Мой аналогичный вопрос относительно символов кандзи / Кана . Как упоминает @coobird, может быть сложно решить, какой диапазон вы хотите проверить, поскольку многие кандзи перекрываются с китайскими иероглифами.

Короче говоря, диапазоны Unicode для хираганы и катаканы:

  • Хирагана: Unicode: 3040-309F
  • Катакана: Unicode: 30A0–30FF

Если вы найдете этот ответ полезным, пожалуйста, проголосуйте за ответ @ coobird и на мой вопрос .

が ん ば っ て!

6
ответ дан 18 December 2019 в 09:50
поделиться

Японские символы не будут в диапазоне ASCII, они будут в Юникоде. Что вы хотите, просто значение char для каждого символа?

2
ответ дан 18 December 2019 в 09:50
поделиться

Я думаю, что то, что вы подразумеваете под кодом ASCII для японского языка, является эквивалентом SBCS (однобайтовый набор символов) для японского языка. Для японского языка у вас есть только MBCS (многобайтовые наборы символов), которые содержат комбинацию однобайтовых и многобайтовых символов. Таким образом, для японского текстового файла, сохраненного в MBCS, у вас есть неяпонские символы (английские буквы и цифры и обычные не буквенно-цифровые символы), сохраненные как один байт, и японские символы, сохраненные как два байта.

Предполагая, что вы не имеете в виду UNICODE , который представляет собой унифицированный DBCS (двухбайтовый набор символов), где каждый символ составляет ровно два байта. На самом деле, чтобы быть более правильным, в последнее время UNICODE также имеет несколько DBCS, потому что набор символов больше не может содержать другие символы. Некоторые символы UNICODE состоят из 4 байтов, в которых первые два байта уже используются в качестве ведущих.

Если вы имеете в виду Первый (MBCS), а не UNICODE, то существует много японских наборов символов, например Shift- JIS (наиболее популярный). Поэтому я предлагаю вам выполнить поиск по карте символов Shift-JIS. Хотя есть и другие карты набора японских символов, кроме Shift-JIS.

-2
ответ дан 18 December 2019 в 09:50
поделиться
Другие вопросы по тегам:

Похожие вопросы: