Какой самый простой способ извлечь данные из PDF?

Мне нужно извлечь данные из некоторых PDF-документов (используя Java). Мне нужно знать, как это сделать проще всего.

Я пробовал iText. Для моих нужд это довольно сложно. Кроме того, я полагаю, что он недоступен бесплатно для коммерческих проектов. Так что это не вариант. Я также попробовал PDFBox и столкнулся с различными ошибками NoClassDefFoundError .

Я погуглил и наткнулся на несколько других вариантов, таких как PDF Clown, jPod, но у меня нет времени экспериментировать со всеми этими библиотеками. Я полагаюсь на опыт сообщества в чтении PDF через Java.

Обратите внимание, что мне не нужно создавать PDF-документы или управлять ими. Мне просто нужно извлечь текстовые данные из документов PDF со средней степенью сложности макета.

Пожалуйста, предложите самый быстрый и простой способ извлечения текста из документов PDF. Спасибо.

9
задан Sebastian Fork 26 July 2011 в 14:37
поделиться