Есть ли способ исправить символы, которые отображаются неправильно после запуска этой разметки html через phpquery :: NewDocument? В исходном документе есть двойные кавычки - классика с современной женщиной - в итоге они отображаются неправильно после создания нового документа с помощью phpquery.
//Original document is UTF-8 encoded
$raw_html = '<html><head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /></head><body><p>Mr. Smith of Bangkok celebrated the “Classics with modern Woman”.</p></body></html>';
print($raw_html);
$aNew_document = phpQuery::newDocument($raw_html);
print($aNew_document);
Исходный вывод: Мистер Смит из Бангкока праздновал «Классику с современной женщиной».
Новый документ Вывод: Мистер Смит из Бангкока праздновал «Классику с современной женщиной».
UTF-8 без BOM
. Добавьте этот заголовок поверх скрипта:
header("Content-Type: text/html; charset=UTF-8");
[EDIT]: Как сохранять файлы в формате UTF-8 без BOM:
По запросу OP, вот как вы можете это сделать в Windows:
У вас есть это в элементе :
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8"/>
Следующим курсом будет использование объектов HTML для отображения этих символов.