Удалить цвет фона при обработке изображений для OCR

Я пытаюсь удалить цвет фона, чтобы повысить точность распознавания текста по изображениям. Пример будет выглядеть так:

enter image description here

Я бы сохранил все буквы в постобработанном изображении, просто удалив светло-фиолетовый текстурированный фон. Можно ли использовать какое-либо программное обеспечение с открытым исходным кодом, такое как Imagemagick, для преобразования его в двоичное изображение (черно-белое) для достижения этой цели? Что делать, если у фона более одного цвета? Будет ли решение таким же?

А что, если я также хочу удалить фиолетовые буквы (название театра) и линию, чтобы оставить только буквы черного цвета? Простая обрезка может не работать, потому что фиолетовые буквы могут появляться и в других местах.

Я ищу решение в программировании, а не с помощью таких инструментов, как Photoshop.

6
задан rmtheis 7 June 2012 в 12:14
поделиться