Нижеприведенный код является решением вопроса на Python 3. Перед запуском кода убедитесь, что вы установили библиотеку PyPDF2
в свою среду. Если не установлено, откройте командную строку и выполните следующую команду:
pip3 install PyPDF2
Код решения:
import PyPDF2
pdfFileObject = open('sample.pdf', 'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObject)
count = pdfReader.numPages
for i in range(count):
page = pdfReader.getPage(i)
print(page.extractText())
(1) Предупреждение состоит в том, что classes_probs
может быть неопределенным в этой точке. Если tags
пусто, первый цикл не выполняется. Вы можете «исправить» это, назначив пустой список перед первым циклом.
(2) Это называется list comprehension
. Используйте этот поисковый термин и найдите учебное пособие на предпочитаемом вами уровне написания и примеров.