Преобразование кодировки символов строки из windows-1252 в utf-8

Я преобразовал документ Word (docx) в html, преобразованный html имеет windows-1252 в качестве кодировки символов. В .Net для этой кодировки 1252 символов все специальные символы отображаются как ' '. Этот html отображается в редакторе Rad Editor, который отображается правильно, если html имеет формат Utf-8.

Я пробовал следующий код, но без жилки

Encoding wind1252 = Encoding.GetEncoding(1252);  
Encoding utf8 = Encoding.UTF8;  
byte[] wind1252Bytes = wind1252.GetBytes(strHtml);  
byte[] utf8Bytes = Encoding.Convert(wind1252, utf8, wind1252Bytes);  
char[] utf8Chars = new char[utf8.GetCharCount(utf8Bytes, 0, utf8Bytes.Length)];   
utf8.GetChars(utf8Bytes, 0, utf8Bytes.Length, utf8Chars, 0);  
string utf8String = new string(utf8Chars);

Есть предложения, как преобразовать HTML в UTF-8?

14
задан Oded 6 April 2011 в 14:32
поделиться