Насколько я понимаю, чтение в файл с кодировкой UTF8 или UTF16 не обязательно может быть случайным из-за случайного суррогатного байта (например, используется в восточных языках).
Как я могу использовать. NET, чтобы перейти к приблизительной позиции в файле и прочитать текст Unicode из полуслучайной позиции?
Могу ли я отбросить суррогатные байты и дождаться разрыва слова, чтобы продолжить чтение? Если да, то какие допустимые разрывы слов мне следует подождать, пока я не начну декодирование?