Как извлекать изображения из PDF с помощью Java (без использования pdfbox)

Я изучаю, как извлечь изображения из большого (> 300 МБ) файла PDF. Я использую pdfbox, но по какой-то конкретной причине, которую я не могу понять, некоторые страницы извлекаются неправильно.

Я использую класс PDFToImage для pdfbox в качестве основы для своего кода.

Итак, вы знаете другую библиотеку, которая может мне в этом помочь? Я знаю, что iText можно использовать, но я читал, что его нельзя использовать для коммерческих продуктов.

Я установил пакеты xpdf и xpdf-utils, и утилита под названием pdfimages работает отлично. Но мне нужно решить эту проблему с Java, и он должен быть переносимым.

6
задан Mark Storer 30 November 2010 в 17:03
поделиться