Я скачал библиотеки tika-core и tika-parser, но не смог найти примеры кодов для синтаксического анализа HTML-документов в строку. Мне нужно избавиться от всех HTML-тегов источника веб-страницы. Что я могу сделать? Как мне запрограммировать это с помощью Apache Tika?