from pyPdf import PdfFileReader f = open('document.pdf', 'rb') p = PdfFileReader(f) o = p.getOutlines()
Объект List
o
состоит из объектов DictionarypyPdf.pdf.Destination
(закладки), который имеет много свойств, но я не могу найти номер страницы этой закладкиКак я могу вернуть номер страницы, допустим
o[1]
закладки?Например
o[1].page. idnum
возвращает число, которое примерно в 3 раза больше, чем номер страницы в PDF документе, который, как я предполагаю, ссылается на какой-то объект меньше страницы, так как выполнение.page.idnum
по всему контуру PDF документа возвращает массив чисел, который даже линейно не коррелирует с "реальными" назначениями номеров страниц в PDF документе и приблизительно кратен ~ 3Обновление: Этот вопрос такой же, как и этот: разделить pdf на основе контура, хотя я не понимаю, что автор сделал в своем самоответе. Мне кажется, что это слишком сложно для использования