Лучший способ разобрать недействительный HTML в PHP

Question

Лучший способ разобрать недействительный HTML в PHP

Есть ли лучший подход для анализа недопустимого HTML, чем применение к нему Tidy?

Примечание: Бывают ситуации, когда Tidy недоступен. Regexp также не рекомендуется, я понял для анализа html.

14

php html parsing

задан danidacar 31 August 2010 в 07:15

2 ответа

Известно, что SimpleHTMLDOM более снисходительна, чем родные функции PHP DOM.

1

ответ дан 1 December 2019 в 16:24

Другие вопросы по тегам:

php html parsing

Похожие вопросы:

score 6 · Accepted Answer

Я бы попробовал что-то вроде этого: http://php.net/manual/en/domdocument.loadhtml.php

С этой страницы:

Функция анализирует HTML, содержащийся в источнике строки. . В отличие от загрузки XML, HTML не обязательно должен быть правильно сформирован для загрузки. Эта функция также может вызываться статически для загрузки и создания объекта DOMDocument.