Я изучаю, как извлечь изображения из большого (> 300 МБ) файла PDF. Я использую pdfbox, но по какой-то конкретной причине, которую я не могу понять, некоторые страницы извлекаются неправильно.
Я использую класс PDFToImage для pdfbox в качестве основы для своего кода.
Итак, вы знаете другую библиотеку, которая может мне в этом помочь? Я знаю, что iText можно использовать, но я читал, что его нельзя использовать для коммерческих продуктов.
Я установил пакеты xpdf и xpdf-utils, и утилита под названием pdfimages работает отлично. Но мне нужно решить эту проблему с Java, и он должен быть переносимым.