Как выполнить произвольное чтение файла UTF8

Question

Как выполнить произвольное чтение файла UTF8

Насколько я понимаю, чтение в файл с кодировкой UTF8 или UTF16 не обязательно может быть случайным из-за случайного суррогатного байта (например, используется в восточных языках).

Как я могу использовать. NET, чтобы перейти к приблизительной позиции в файле и прочитать текст Unicode из полуслучайной позиции?

Могу ли я отбросить суррогатные байты и дождаться разрыва слова, чтобы продолжить чтение? Если да, то какие допустимые разрывы слов мне следует подождать, пока я не начну декодирование?

5

c# unicode utf-8 utf-16 utf8-decode

задан Community 23 May 2017 в 11:44

0 ответов

Другие вопросы по тегам:

c# unicode utf-8 utf-16 utf8-decode

Как выполнить произвольное чтение файла UTF8

0 ответов

Похожие вопросы: