php DomDocument добавляет дополнительные теги

Я пытаюсь проанализировать документ и получить все теги изображений и изменить источник на что-то другое.


    $domDocument = new DOMDocument();

    $domDocument->loadHTML($text);

    $imageNodeList = $domDocument->getElementsByTagName('img');

    foreach ($imageNodeList as $Image) {
      $Image->setAttribute('src', 'lalala');
      $domDocument->saveHTML($Image);
    }

    $text = $domDocument->saveHTML();

$ text изначально выглядит так:


<p>Hi, this is a test, here is an image<img src="http://mysite.com/beer.jpg" width="60" height="95" /> Because I like Beer!</p>

и это результат $ text:


<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd">
<html><body><p>Hi, this is a test, here is an image<img src="lalala" width="68" height="95"> Because I like Beer!</p></body></html>

Я получаю кучу дополнительных тегов (html, body и комментарий вверху), которые мне действительно не нужны. Есть ли способ настроить DOMDocument, чтобы избежать добавления этих дополнительных тегов?

Спасибо!

9
задан Onema 26 January 2011 в 00:45
поделиться