Использовать textract.
Он поддерживает множество типов файлов, включая файлы PDF
import textract text = textract.process("path/to/file.extension")