Как определить файлы PDF, для которых требуется распознавание текста?

У меня более 30 000 файлов pdf. Некоторые файлы уже поддерживают OCR, а некоторые нет. Есть ли способ узнать, какие файлы уже имеют оптическое распознавание символов, а какие - только изображения?

Это займет вечность, если я прогоню каждый файл через процессор оптического распознавания текста.

7
задан Fuji - H2O 12 October 2011 в 13:39
поделиться