Я хотел бы знать, как удалить белые поля из PDF-файла. Так же, как это делает Adobe Acrobat X Pro. Я понимаю, что это не будет работать с каждым файлом PDF.
Я предполагаю, что способ сделать это — получить текстовые поля, а затем обрезать эти поля.
PyPdf является предпочтительным.
iText находит текстовые поля на основе этого кода:
public void addMarginRectangle(String src, String dest)
throws IOException, DocumentException {
PdfReader reader = new PdfReader(src);
PdfReaderContentParser parser = new PdfReaderContentParser(reader);
PdfStamper stamper = new PdfStamper(reader, new FileOutputStream(RESULT));
TextMarginFinder finder;
for (int i = 1; i <= reader.getNumberOfPages(); i++) {
finder = parser.processContent(i, new TextMarginFinder());
PdfContentByte cb = stamper.getOverContent(i);
cb.rectangle(finder.getLlx(), finder.getLly(),
finder.getWidth(), finder.getHeight());
cb.stroke();
}
stamper.close();
}