Поэтому я часто запускаю огромные задания двустороннего сканирования на неразумном многофункциональном устройстве Canon, в результате чего у меня остается огромная папка с файлами JPEG. Неужели я сошел с ума, если подумал об использовании PIL для анализа папки с изображениями, чтобы обнаружить сканирование пустых страниц и пометить их для удаления?
Если вы не укажете сканирование папок и отметку частей, это будет выглядеть примерно так:
- Проверить если изображение в оттенках серого, поскольку это считается неопределенным.
- Если да, определите доминирующий диапазон оттенков (цвет фона).
- Если нет, определите преобладающий диапазон оттенков, ограничиваясь светлыми оттенками серого.
- Определите, какой процент всего изображения состоит из указанных оттенков.
- Попытайтесь найти порог, который адекватно определяет страницы с шрифтом, письмом или изображениями.
- Возможно, тестируйте фрагменты изображения за раз, чтобы повысить точность порога.
Я знаю, что это своего рода крайний случай, но может ли кто-нибудь с опытом PIL предоставить указатели?
задан skaffman 15 May 2011 в 13:18
поделиться