Как не выйти из символьной сущности HTML в Java?

В основном я хотел бы декодировать данный документ HTML и заменить все специальные символы, такой как " " -> " ", ">" -> ">".

В.NET мы можем использовать HttpUtility.HtmlDecode.

Какова эквивалентная функция в Java?

133
задан tk_ 18 October 2019 в 02:06
поделиться

1 ответ

Я использовал Apache Commons StringEscapeUtils.unescapeHtml4 () для этого:

Отменяет экранирование строки, содержащей объект экранирует строку, содержащую фактические символы Unicode соответствующие побегам. Поддерживает Сущности HTML 4.0.

174
ответ дан 24 November 2019 в 00:01
поделиться
Другие вопросы по тегам:

Похожие вопросы: