Oracle:
select * from (select foo from bar order by foo) where ROWNUM = x
используйте iText. Следующий фрагмент, например, извлечет текст:
PdfTextExtractor parser =new PdfTextExtractor(new PdfReader("C:/Text.pdf")); parser.getTextFromPage(3);
PDFBox не работает во многих новых PDF-файлах, особенно со встроенными изображениями PNG.
Я был очень впечатлен PDFTextStream
JPedal
и Multivalent
также предлагает извлечение текста в Java
или вы можете получить доступ к xpdf
, используя Runtime.exec