Я ищу дезинфицирующее средство HTML, которое я могу назвать на API для очистки строк, которые я получаю от своего веб-приложения. Разве существуют ли, некоторые полезные простой в использовании освобождают доступный? Кто-либо знает, возможно, один или два?
Мне не нужно что-то большое, оно просто должно быть в состоянии найти открытые теги и закрыть их.
Кроме JTidy вы также можете взглянуть на:
Nekohtml
TagSoup
Получение текста в HTmL документе