Лучший способ разобрать недействительный HTML в PHP

Есть ли лучший подход для анализа недопустимого HTML, чем применение к нему Tidy?

Примечание: Бывают ситуации, когда Tidy недоступен. Regexp также не рекомендуется, я понял для анализа html.

14
задан danidacar 31 August 2010 в 07:15
поделиться

2 ответа

Я бы попробовал что-то вроде этого: http://php.net/manual/en/domdocument.loadhtml.php

С этой страницы:

Функция анализирует HTML, содержащийся в источнике строки. . В отличие от загрузки XML, HTML не обязательно должен быть правильно сформирован для загрузки. Эта функция также может вызываться статически для загрузки и создания объекта DOMDocument.

6
ответ дан 1 December 2019 в 16:24
поделиться

Известно, что SimpleHTMLDOM более снисходительна, чем родные функции PHP DOM.

1
ответ дан 1 December 2019 в 16:24
поделиться
Другие вопросы по тегам:

Похожие вопросы: