Я должен очистка некоторый HTML-код для удаления <style>
и <link>
теги в <body>
тег. Я уже использую PHP, Опрятный, чтобы сделать некоторую очистку, но я не сделал найденный, как удалить те теги с Опрятным PHP.
У Вас есть решение? Или возможно другой инструмент для очистки разметки класс PHP...
Дон Не знаю, как это сделать с Tidy, но вы можете использовать DOM
$dom = new DOMDocument; // init new DOMDocument
$dom->loadHTML($html); // load HTML into it
$xpath = new DOMXPath($dom); // create a new XPath
$nodes = $xpath->query('//body/style'); // Find all style elements in body tag
foreach($nodes as $node) { // Iterate over found elements
$node->parentNode->removeChild($node); // Remove complete style node
}
echo $dom->saveHTML(); // output cleaned HTML
. Для элементов
настройте Xpath на // body / link
.
Альтернативой Tidy может стать http://htmlpurifier.org/
HTML Purifier - это отвечающая стандартам Библиотека фильтров HTML, написанная на PHP. HTML Purifier не только удалит весь вредоносный код (более известный как XSS) с помощью тщательно проверенного, безопасным, но разрешительным белым списком, он также обеспечит соответствие ваших документов соответствие стандартам, что достижимо только при наличии всестороннего знания спецификаций W3C.
Сделал этот ответ дополнительным, поскольку он совершенно не связан с решением DOM.