У меня более 30 000 файлов pdf. Некоторые файлы уже поддерживают OCR, а некоторые нет. Есть ли способ узнать, какие файлы уже имеют оптическое распознавание символов, а какие - только изображения?
Это займет вечность, если я прогоню каждый файл через процессор оптического распознавания текста.