Как исправить недопустимые символы HTML на страницах, обслуживаемых с другой кодировкой?

У меня есть несколько веб-сайтов, которые отображают недопустимые символы. Мета-теги страниц определяют кодировку UTF-8. Однако некоторые страницы содержат символы, которые не могут быть интерпретированы UTF-8, вероятно, потому, что файлы были сохранены в другой кодировке (например, ANSI). В частности, меня сейчас беспокоит причудливый апостроф (например, « Bob's » ... извините, если это не отображается правильно). W3 ' Валидатор s указывает, что сущность - « \ x92 », но он не проверяет файл, потому что он не отображается в Unicode. И, конечно же, если я открою файл в Notepad ++ и изменю кодировку на UTF-8, в черном ящике символ будет заменен на 92.

Вот мой вопрос: как проще всего это исправить? Обязательно ли открывать все страницы и заменять этот символ обычным апострофом? Или есть быстрое исправление, которое я мог бы добавить (скажем, в IIS), которое могло бы переопределить или исправить проблему кодирования? Или мне нужно найти / заменить перебором? У меня сотни страниц на этих веб-сайтах, и я понятия не имею, сколько из них мне придется изменить, поэтому, если кто-то знает, как я могу обойти эту проблему или исправить ее быстро, я был бы признателен.

8
задан Andy 30 September 2010 в 17:42
поделиться