Ответ: Нет.
Хотя вы могли бы написать некоторый javascript, который бы устанавливал атрибут selected
для option
на основе параметра в теге select
, но вы затем изменили бы DOM
, что приведет к вашему примеру # 1. [ 116]
Так что нет, в HTML5 нет способа получить DOM
, как вы просили.
HTMLparser является хорошим синтаксическим анализатором HTML.
Я использовал это для парсинга HTML на одном из моих проектов.
Можно записать собственные фильтры для парсинга HTML для того, что Вы хотите, таким образом, <br>
тег не должно быть трудно проанализировать
Эй может проанализировать CSS с помощью CssSelectorNodeFilter
Если HTML является "правильно построенным XML" (XHTML), почему бы не использовать синтаксический анализатор XML (такой как Xerces) и затем осмотреть программно дерево DOM.
Adobe Acrobat Pro позволяет Вам захватывать сайты через HTTP и делает превосходное задание сохранения стиля и расположения. Я не использовал его от аспекта API, но это может стоить изучить.
Вы, вероятно, были бы более обеспеченным получением компонента, который идет непосредственно от HTML до PDF или Word, затем чтобы попытаться проанализировать документ HTML и копировать форматирование себя на основе HTML. Если Вы хотите преобразовать HTML в PDF, и Вы используете .NET, Winnovative предоставляет хорошее решение.
Проверьте летающую тарелку xhtml рендерер - они представляют правильно построенные файлы XHTML к PDF и позволяют Вам управлять выводом с помощью CSS.