Как выполнить произвольное чтение файла UTF8

Насколько я понимаю, чтение в файл с кодировкой UTF8 или UTF16 не обязательно может быть случайным из-за случайного суррогатного байта (например, используется в восточных языках).

Как я могу использовать. NET, чтобы перейти к приблизительной позиции в файле и прочитать текст Unicode из полуслучайной позиции?

Могу ли я отбросить суррогатные байты и дождаться разрыва слова, чтобы продолжить чтение? Если да, то какие допустимые разрывы слов мне следует подождать, пока я не начну декодирование?

5
задан Community 23 May 2017 в 11:44
поделиться