Разбор HTML с помощью C

Внутри catalina.bat установите порт, на котором вы хотите запустить отладчик

if not "%JPDA_ADDRESS%" == "" goto gotJpdaAddress
set JPDA_ADDRESS=9001

. Тогда вы можете просто запустить отладчик с помощью

catalina.bat jpda 

Теперь из Eclipse или IDEA выбирает удаленную отладку и начинает отлаживать, подключаясь к порту 9001.

15
задан moopet 8 August 2016 в 10:06
поделиться

3 ответа

Для этого вы хотите использовать HTML tidy. На странице Lib curl есть некоторый исходный код, который поможет вам начать работу. Документы, перемещающиеся по дереву доменов. Вам не нужен синтаксический анализатор xml. Не терпит неудач на плохо отформатированном HTML.

http://curl.haxx.se/libcurl/c/htmltidy.html

12
ответ дан 1 December 2019 в 03:14
поделиться

Я бы использовал libhtmltidy + любой синтаксический анализатор xml, например expat или libxml . Зависит от того, что вы ищете.

7
ответ дан 1 December 2019 в 03:14
поделиться

Если вы хотите анализировать XML с помощью C, то, безусловно, лучший способ продолжить - использовать библиотеку LibXML. Главная страница находится по адресу http://xmlsoft.org/ . В дополнение к своим загрузкам у них есть явные примеры кода , которые конкретно показывают, как обрабатывать синтаксический анализ . Я точно знаю, что вы можете получить версии, предварительно скомпилированные для Mac и Windows, в большинство дистрибутивов Linux и BSD он уже включен, и вы можете собрать его из исходников, если хотите.

2
ответ дан 1 December 2019 в 03:14
поделиться
Другие вопросы по тегам:

Похожие вопросы: