Существует ли код C++ или библиотека для преобразования документа HTML XML-документу?Спасибо.
Вы можете посмотреть Библиотека Tidy
Tidy состоит из анализатора HTML и красивого принтера HTML. Синтаксический анализатор делает все возможное, чтобы исправить распространенные ошибки разметки. Он также содержит советы о том, как сделать ваши страницы более доступными для людей с ограниченными возможностями, и может использоваться для преобразования HTML-содержимого в XML как {{ 1}} XHTML.
Библиотека написана на C.
Если ваш XHTML правильно сформирован, то это практически XML.
Если вы используете любой C++ xml парсер, вы можете загрузить документ... и надеяться, что он сможет его разобрать, а затем снова записать его обратно.
Я хотел преобразовать в XML, чтобы проанализировать его с помощью libxml ++, но нашел эту библиотеку: http://htmlcxx.sourceforge.net/ С ней я может анализировать XML и HTML без преобразования.