2
ответа

конвертировать из PDF в текст: строки и слова разбиты

Я хочу преобразовать файл PDF в текст с помощью PyPDF2, но преобразованный текст выглядит иначе, чем файл PDF. В частности, одна строка в PDF разбита на несколько строк в тексте, и слова также могут быть разбиты. ...
вопрос задан: 18 March 2019 11:43
0
ответов

Извлечение текста из PDF с использованием PyPDF2

Моя задача - прочитать файлы pdf (отсканированные документы, текстовые или в другом формате) и около 600 файлов из каталога и получить из них текст. Для случаев, когда это изображение или ...
вопрос задан: 19 January 2019 00:03