Внутри catalina.bat установите порт, на котором вы хотите запустить отладчик
if not "%JPDA_ADDRESS%" == "" goto gotJpdaAddress
set JPDA_ADDRESS=9001
. Тогда вы можете просто запустить отладчик с помощью
catalina.bat jpda
Теперь из Eclipse или IDEA выбирает удаленную отладку и начинает отлаживать, подключаясь к порту 9001.
Для этого вы хотите использовать HTML tidy. На странице Lib curl есть некоторый исходный код, который поможет вам начать работу. Документы, перемещающиеся по дереву доменов. Вам не нужен синтаксический анализатор xml. Не терпит неудач на плохо отформатированном HTML.
Я бы использовал libhtmltidy + любой синтаксический анализатор xml, например expat или libxml . Зависит от того, что вы ищете.
Если вы хотите анализировать XML с помощью C, то, безусловно, лучший способ продолжить - использовать библиотеку LibXML. Главная страница находится по адресу http://xmlsoft.org/ . В дополнение к своим загрузкам у них есть явные примеры кода , которые конкретно показывают, как обрабатывать синтаксический анализ . Я точно знаю, что вы можете получить версии, предварительно скомпилированные для Mac и Windows, в большинство дистрибутивов Linux и BSD он уже включен, и вы можете собрать его из исходников, если хотите.