Использование PIL для обнаружения сканирования пустой страницы

Поэтому я часто запускаю огромные задания двустороннего сканирования на неразумном многофункциональном устройстве Canon, в результате чего у меня остается огромная папка с файлами JPEG. Неужели я сошел с ума, если подумал об использовании PIL для анализа папки с изображениями, чтобы обнаружить сканирование пустых страниц и пометить их для удаления?

Если вы не укажете сканирование папок и отметку частей, это будет выглядеть примерно так:

  • Проверить если изображение в оттенках серого, поскольку это считается неопределенным.
  • Если да, определите доминирующий диапазон оттенков (цвет фона).
  • Если нет, определите преобладающий диапазон оттенков, ограничиваясь светлыми оттенками серого.
  • Определите, какой процент всего изображения состоит из указанных оттенков.
  • Попытайтесь найти порог, который адекватно определяет страницы с шрифтом, письмом или изображениями.
  • Возможно, тестируйте фрагменты изображения за раз, чтобы повысить точность порога.

Я знаю, что это своего рода крайний случай, но может ли кто-нибудь с опытом PIL предоставить указатели?

5
задан skaffman 15 May 2011 в 13:18
поделиться