Как я могу использовать парсер HTML с Apache Tika на Java для извлечения все HTML-теги?

Я скачал библиотеки tika-core и tika-parser, но не смог найти примеры кодов для синтаксического анализа HTML-документов в строку. Мне нужно избавиться от всех HTML-тегов источника веб-страницы. Что я могу сделать? Как мне запрограммировать это с помощью Apache Tika?

7
задан lkalay 11 April 2017 в 19:24
поделиться