Я использую Apache PDFBox для чтения PDF-документа, иерархия которого определяется закладками. Иерархия имеет форму дерева с содержимым только на уровне листа.
Извлечение текста между двумя конечными закладками с использованием следующего кода:
Stripper.setStartBookmark(),
Stripper.setEndBookmark(),
Stripper.writeText()),
Вместо этого возвращает текст на всей странице. Короче, моя проблема похожа на упомянутую в этой ветке.
Есть ли способ извлечь содержимое между двумя закладками?
Если да, то что нужно изменить в моем коде?