Действительно ли UTF-8 приемлем для чтения/записи азиатских языков?

Question

Действительно ли UTF-8 приемлем для чтения/записи азиатских языков?

Если это - выполнение кода в цикле, который, вероятно, вызовет исключение много раз, то выдавание исключения не является хорошей вещью, потому что они являются довольно медленными для большого N. Но нет ничего неправильно с выдачей пользовательских исключений, если производительность не является проблемой. Просто удостоверьтесь, что у Вас есть основное исключение что они все inherite, названный BaseException или чем-то как этот. BaseException наследовал Систему. Исключение, но все Ваши исключения наследовало BaseException. У Вас может даже быть дерево Типов исключительной ситуации для группировки подобных типов, но это может или не может быть излишеством.

Так, короткий ответ - то, что, если это не вызывает значительную потерю производительности (который это не должно, если Вы не выдаете много исключений), затем идите вперед.

7

c# unicode utf-8

задан Jon Tackabury 11 August 2009 в 17:45

5 ответов

Если вы работаете с большим количеством азиатского текста (в большей степени, чем латинский), вы можете рассмотреть UTF-16. UTF-8 может точно представлять весь диапазон символов Unicode, но он оптимизирован для текста, который в основном состоит из ASCII. UTF-16 занимает мало места по всей базовой многоязычной плоскости .

Но UTF-8, безусловно, «достаточно хорош» - не будет коррупции просто потому, что вы используете UTF-8 поверх , скажем, UTF-16.

10

ответ дан 6 December 2019 в 06:37

UTF-8 может представлять любой символ Юникода.

2

ответ дан 6 December 2019 в 06:37

Насколько мне известно, UTF-8 предназначен для охвата всех этих ранних вариаций Unicode, так что да, его можно использовать поверх UCS-2. См. http://www.unicode.org/versions/Unicode5.1.0/ и посмотрите на боковую панель, чтобы найти главы книги 5.0; части 9–12 должны быть тем, что вам нужно.

1

ответ дан 6 December 2019 в 06:37

Он прекрасно работает с Деванагари.

0

ответ дан 6 December 2019 в 06:37

Другие вопросы по тегам:

c# unicode utf-8

Действительно ли UTF-8 приемлем для чтения/записи азиатских языков?

5 ответов

Похожие вопросы: