4
ответа

Обрезка страниц в файле PDF

Мне было интересно, есть ли у кого-нибудь опыт программной работы с файлами .pdf. У меня есть файл .pdf, и мне нужно обрезать каждую страницу до определенного размера. После быстрого поиска в Google я нашел ...
вопрос задан: 28 September 2018 18:07
4
ответа

Быстрая библиотека разделителя PDF

pyPdf является большой библиотекой, чтобы разделить, объединить файлы PDF. Я использую его для разделения документов PDF на документы на 1 страницу. pyPdf является чистым Python и проводит довольно много времени в _sweepIndirectReferences ()...
вопрос задан: 7 August 2009 15:20
3
ответа

pyPdf для извлечения IndirectObject

Следуя этому примеру, я могу перечислить все элементы в pyPdf pdf импорта файла PDF = pyPdf. PdfFileReader (открывают ("pdffile.pdf")), список (pdf.pages) # Процесс все объекты. распечатайте pdf.resolvedObjects теперь...
вопрос задан: 20 August 2012 22:54
2
ответа

конвертировать из PDF в текст: строки и слова разбиты

Я хочу преобразовать файл PDF в текст с помощью PyPDF2, но преобразованный текст выглядит иначе, чем файл PDF. В частности, одна строка в PDF разбита на несколько строк в тексте, и слова также могут быть разбиты. ...
вопрос задан: 18 March 2019 11:43
2
ответа

Извлечение отображает от PDF без передискретизации в Python?

Как можно было бы извлечь все изображения из документа PDF в родном разрешении и формате? (Значение tiff извлечения как tiff, jpeg как jpeg, и т.д. и не передискретизируя). Расположение неважно, я не забочусь...
вопрос задан: 11 December 2015 21:43
1
ответ

Как считать линию за линией в использовании файла PDF PyPdf?

У меня есть некоторый код для чтения из файла PDF. Существует ли способ считать линию за линией из файла PDF (не страницы) использование Pypdf, Python 2.6, в Windows? Вот код для того, чтобы прочитать страницы PDF: импорт...
вопрос задан: 15 July 2015 23:31
1
ответ

Метаданные изменения файла PDF с pypdf

Я хотел бы создать/изменить заголовок документа PDF с помощью pypdf. Кажется, что заголовок только для чтения. Существует ли способ получить доступ к этим метаданным r/w? Если бы положительный ответ, часть кода была бы...
вопрос задан: 22 June 2012 02:18
1
ответ

разделите PDF на основе схемы

я хотел бы использовать pyPdf для разделения файла PDF на основе схемы, где каждое место назначения в схеме обращается к различной странице в PDF. схема в качестве примера: основной-> указывает на страницу 1...
вопрос задан: 16 December 2009 23:00
1
ответ

чтение/запись xmp metadatas на файлах PDF через pypdf

Я могу считать xmp metadatas через pyPdf с этим кодом: = pyPdf. PdfFileReader (открытый (self.fileName)) b = a.getXmpMetadata () c = b.pdf_keywords, но: действительно ли это - лучший способ? И...
вопрос задан: 21 January 2009 19:43
0
ответов

Как получить номер страницы закладки

from pyPdf import PdfFileReader f = open('document.pdf', 'rb') p = PdfFileReader(f) o = p.getOutlines() Объект List object o состоит из объектов Dictionary pyPdf.pdf.Destination (закладки), который имеет много ...
вопрос задан: 23 May 2017 12:25
0
ответов

Как сдвинуть все страницы документа PDF вправо на один дюйм?

Я хочу сдвинуть все страницы существующего документа PDF вправо на один дюйм, чтобы в них можно было пробить три отверстия, не затрагивая содержимое. Документы pdf уже будут сгенерированы, поэтому меняем способ ...
вопрос задан: 23 May 2017 12:07
0
ответов

Почему мой код неправильно разделяет каждую страницу в отсканированном PDF-файле?

Обновление: спасибо stardt, чей сценарий работает! PDF-файл - это страница другого. Я пробовал сценарий на другом, и он также правильно выводил каждую страницу pdf, но порядок номеров страниц ...
вопрос задан: 13 April 2017 12:36
0
ответов

Преобразование PDF-файла, состоящего из таблиц, в текстовый документ, содержащий таблицы в Python

У меня есть этот PDF-файл, который состоит из общих таблиц, состоящих из имен, адреса, номера телефона, номера факса. Я хочу это: 1) прочитать этот файл и получить содержимое каждой строки и положить его в базу данных. то есть ...
вопрос задан: 25 February 2015 17:57
0
ответов

Не удается установить модуль PyPdf 2

Пытаясь установить модуль PyPdf2, я скачал zip и распаковал его, я выполнил сборку python setup.py и python setup.py, но, кажется, он не был установлен, когда я пытаюсь импортировать ...
вопрос задан: 8 October 2012 13:28
0
ответов

Разбор PDF без объекта /Root с помощью PDFMiner

Я пытаюсь извлечь текст из большого количества PDF-файлов, используя привязки Python PDFMiner. Модуль, который я написал, работает для многих PDF-файлов, но я получаю эту загадочную ошибку для подмножества PDF-файлов :ipython...
вопрос задан: 13 July 2012 21:24
0
ответов

Пробелы исчезли из извлечения PDF и странная интерпретация слов

Используя приведенный ниже фрагмент, я попытался извлечь текстовые данные из этого PDF-файла. файл. import pyPdf def get_text(path): # Загрузить PDF в pyPDF pdf = pyPdf.PdfFileReader(file(path, "rb")) # ...
вопрос задан: 19 June 2012 03:08
0
ответов

pyPdf игнорирует новые строки в файле PDF

Я пытаюсь извлечь каждую страницу PDF в виде строки: import pyPdf pages = [] pdf = pyPdf.PdfFileReader (файл ('g-reg-101.pdf', 'rb')) для i в диапазоне (0, pdf.getNumPages()): this_page = pdf.getPage(...
вопрос задан: 13 June 2012 14:43
0
ответов

PDF -Удаление белых полей

Я хотел бы знать, как удалить белые поля из файла PDF. Так же, как это делает Adobe Acrobat X Pro. Я понимаю, что это не будет работать с каждым файлом PDF. Я бы предположил, что это можно сделать с помощью...
вопрос задан: 2 May 2012 18:43
0
ответов

Открытие pdf URL-адресов с помощью pyPdf

Как бы я открыл pdf с URL, а не с диска Что-то вроде input1 = PdfFileReader(file("http://example.com/a.pdf", "rb")) Я хочу открыть несколько файлов из Интернета и загрузить слияние ...
вопрос задан: 17 March 2012 16:05
0
ответов

Скрипт Python для удалить пустые страницы с помощью pyPDF

Я пытаюсь написать пару сценариев python с использованием pyPDF, чтобы разделить страницы PDF на шесть отдельных страниц, правильно их упорядочить (обычно печатаются спереди и сзади, поэтому каждая вторая страница должна иметь свои ...
вопрос задан: 10 June 2011 17:53
0
ответов

Create outlines/TOC for existing PDF in Python

I'm using pyPdf to merge several PDF files into one. This works great, but I would also need to add a table of contents/outlines/bookmarks to the PDF file that is generated. pyPdf seems to have only ...
вопрос задан: 27 May 2011 20:38
0
ответов

как вставить строку в PDF с помощью pypdf?

извините, .. Я новичок в Python .. Мне нужно создать файл pdf, не используя существующие файлы pdf .. (чистое создание нового) у меня есть поиск в Google, и многие из них объединяют 2 pdf или создают новый файл ...
вопрос задан: 25 May 2011 04:16
0
ответов

Как объединить два горизонтальных PDF-файла страницы с использованием pyPdf

У меня проблемы с объединением двух файлов PDF с pyPdf. Когда я запускаю следующий код, водяной знак (page1) выглядит нормально, но page2 повернут на 90 градусов по часовой стрелке. Есть идеи, что происходит ...
вопрос задан: 18 May 2011 07:26
0
ответов

Как закрыть дескриптор файла класса pyPDF «PdfFileReader»

это должен быть очень простой вопрос, на который я не мог ответить из pyPdf ...
вопрос задан: 12 December 2010 15:09
0
ответов

Как открыть сгенерированный файл PDF в браузере?

У меня есть написал слияние Pdf, которое объединяет исходный файл с водяным знаком. Теперь я хочу открыть файл document-output.pdf в браузере с помощью представления Django. Я уже проверил Django ...
вопрос задан: 22 September 2010 08:35