Использовать парсер HTML вместо регулярного выражения. Это мертво просто с помощью Jsoup .
public static String html2text(String html) {
return Jsoup.parse(html).text();
}
Jsoup также поддерживает удаление HTML-тэгов с настраиваемым «белым списком», что очень полезно, если вы хотите разрешить только ,
и
.