Я преобразовал документ Word (docx) в html, преобразованный html имеет windows-1252 в качестве кодировки символов. В .Net для этой кодировки 1252 символов все специальные символы отображаются как ' '. Этот html отображается в редакторе Rad Editor, который отображается правильно, если html имеет формат Utf-8.
Я пробовал следующий код, но без жилки
Encoding wind1252 = Encoding.GetEncoding(1252);
Encoding utf8 = Encoding.UTF8;
byte[] wind1252Bytes = wind1252.GetBytes(strHtml);
byte[] utf8Bytes = Encoding.Convert(wind1252, utf8, wind1252Bytes);
char[] utf8Chars = new char[utf8.GetCharCount(utf8Bytes, 0, utf8Bytes.Length)];
utf8.GetChars(utf8Bytes, 0, utf8Bytes.Length, utf8Chars, 0);
string utf8String = new string(utf8Chars);
Есть предложения, как преобразовать HTML в UTF-8?