Я ищу документацию (официальную документацию, если это возможно) для библиотек TagSoup и jTidy.
Я хочу использовать это библиотеки для управления файлами HTML "tagsoup", которые включают теги xml с разными пространствами имен, смешанными между тегами html (html, xhtml или html5).
Я тестировал HTMLCleaner, NekoHTML и Jericho, но не нашел документации для jTidy и TagSoup , помимо простейших примеров очистки файла.
Мне нужна документация по управлению содержимым, После проверки всех параметров я использовал StAX / Woodstox :