Вы не можете избежать зависимости Ghostscript. Даже Imagemagick полагается на Ghostscript для своих функций чтения PDF. Причиной этого является сложность формата PDF: PDF только содержит растровую информацию, но главным образом векторные формы, диапозитивы и т.д., Кроме того, которые это довольно сложно для выяснения, какой из этих объектов появляется на который страница.
, Таким образом, корректный рендеринг Страницы PDF ясно вне объема для чистой библиотеки Python.
хорошие новости - то, что Ghostscript предварительно установлен на многих окнах и системах Linux, потому что он также необходим всем тем Принтерам PDF (кроме Adobe Acrobat).
В Firefox, если вы выделите весь текст (например, Ctrl-A) на странице, вы можете щелкнуть правой кнопкой мыши и выбрать «Просмотреть источник выбора», который покажет вам, что было отрисовано, а не чем источник документа.
Если используется браузер Firefox, вы можете установить Firebug и просмотреть сгенерированный HTML-код.
Загрузите этот инструмент просмотра для Internet Explorer от Microsoft.