Мне было интересно, есть ли у кого-нибудь опыт программной работы с файлами .pdf. У меня есть файл .pdf, и мне нужно обрезать каждую страницу до определенного размера. После быстрого поиска в Google я нашел ...
pyPdf является большой библиотекой, чтобы разделить, объединить файлы PDF. Я использую его для разделения документов PDF на документы на 1 страницу. pyPdf является чистым Python и проводит довольно много времени в _sweepIndirectReferences ()...
Следуя этому примеру, я могу перечислить все элементы в pyPdf pdf импорта файла PDF = pyPdf. PdfFileReader (открывают ("pdffile.pdf")), список (pdf.pages) # Процесс все объекты. распечатайте pdf.resolvedObjects теперь...
Я хочу преобразовать файл PDF в текст с помощью PyPDF2, но преобразованный текст выглядит иначе, чем файл PDF. В частности, одна строка в PDF разбита на несколько строк в тексте, и слова также могут быть разбиты. ...
Как можно было бы извлечь все изображения из документа PDF в родном разрешении и формате? (Значение tiff извлечения как tiff, jpeg как jpeg, и т.д. и не передискретизируя). Расположение неважно, я не забочусь...
У меня есть некоторый код для чтения из файла PDF. Существует ли способ считать линию за линией из файла PDF (не страницы) использование Pypdf, Python 2.6, в Windows? Вот код для того, чтобы прочитать страницы PDF: импорт...
Я хотел бы создать/изменить заголовок документа PDF с помощью pypdf. Кажется, что заголовок только для чтения. Существует ли способ получить доступ к этим метаданным r/w? Если бы положительный ответ, часть кода была бы...
я хотел бы использовать pyPdf для разделения файла PDF на основе схемы, где каждое место назначения в схеме обращается к различной странице в PDF. схема в качестве примера: основной-> указывает на страницу 1...
Я могу считать xmp metadatas через pyPdf с этим кодом: = pyPdf. PdfFileReader (открытый (self.fileName)) b = a.getXmpMetadata () c = b.pdf_keywords, но: действительно ли это - лучший способ? И...
from pyPdf import PdfFileReader
f = open('document.pdf', 'rb')
p = PdfFileReader(f)
o = p.getOutlines() Объект List object o состоит из объектов Dictionary pyPdf.pdf.Destination (закладки), который имеет много ...
Я хочу сдвинуть все страницы существующего документа PDF вправо на один дюйм, чтобы в них можно было пробить три отверстия, не затрагивая содержимое. Документы pdf уже будут сгенерированы, поэтому меняем способ ...
Обновление: спасибо stardt, чей сценарий работает! PDF-файл - это страница другого. Я пробовал сценарий на другом, и он также правильно выводил каждую страницу pdf, но порядок номеров страниц ...
У меня есть этот PDF-файл, который состоит из общих таблиц, состоящих из имен, адреса, номера телефона, номера факса. Я хочу это: 1) прочитать этот файл и получить содержимое каждой строки и положить его в базу данных. то есть ...
Пытаясь установить модуль PyPdf2, я скачал zip и распаковал его, я выполнил сборку python setup.py и python setup.py, но, кажется, он не был установлен, когда я пытаюсь импортировать ...
Я пытаюсь извлечь текст из большого количества PDF-файлов, используя привязки Python PDFMiner. Модуль, который я написал, работает для многих PDF-файлов, но я получаю эту загадочную ошибку для подмножества PDF-файлов :ipython...
Используя приведенный ниже фрагмент, я попытался извлечь текстовые данные из этого PDF-файла. файл. import pyPdf def get_text(path): # Загрузить PDF в pyPDF pdf = pyPdf.PdfFileReader(file(path, "rb")) # ...
Я пытаюсь извлечь каждую страницу PDF в виде строки: import pyPdf pages = []
pdf = pyPdf.PdfFileReader (файл ('g-reg-101.pdf', 'rb'))
для i в диапазоне (0, pdf.getNumPages()): this_page = pdf.getPage(...
Я хотел бы знать, как удалить белые поля из файла PDF. Так же, как это делает Adobe Acrobat X Pro. Я понимаю, что это не будет работать с каждым файлом PDF. Я бы предположил, что это можно сделать с помощью...
Как бы я открыл pdf с URL, а не с диска Что-то вроде input1 = PdfFileReader(file("http://example.com/a.pdf", "rb")) Я хочу открыть несколько файлов из Интернета и загрузить слияние ...
Я пытаюсь написать пару сценариев python с использованием pyPDF, чтобы разделить страницы PDF на шесть отдельных страниц, правильно их упорядочить (обычно печатаются спереди и сзади, поэтому каждая вторая страница должна иметь свои ...
I'm using pyPdf to merge several PDF files into one. This works great, but I would also need to add a table of contents/outlines/bookmarks to the PDF file that is generated. pyPdf seems to have only ...
извините, .. Я новичок в Python .. Мне нужно создать файл pdf, не используя существующие файлы pdf .. (чистое создание нового)
у меня есть поиск в Google, и многие из них объединяют 2 pdf или создают новый файл ...
У меня проблемы с объединением двух файлов PDF с pyPdf. Когда я запускаю следующий код, водяной знак (page1) выглядит нормально, но page2 повернут на 90 градусов по часовой стрелке. Есть идеи, что происходит ...
У меня есть написал слияние Pdf, которое объединяет исходный файл с водяным знаком. Теперь я хочу открыть файл document-output.pdf в браузере с помощью представления Django. Я уже проверил Django ...