Введение в OCR

Кто-то дал мне клад, полный удивительной информации. Это 200 МБ изображений в формате .tiff отсканированных объявлений, созданных до 40-х годов. Я хочу оцифровать это, но ничего не знаю об оптическом распознавании текста. Некоторые ранние материалы едва ли могут прочитать человек, не говоря уже о машине. Это также на иврите.

Я ищу совета, как это сделать. Хорошее предложение о книгах, статьях, библиотеках кода или программном обеспечении (все они должны быть бесплатно доступны в Интернете). Я хорошо владею C ++ и Python и могу выбрать другой язык, если это необходимо.

Спасибо.

7
задан CamelCamelCamel 30 April 2011 в 22:27
поделиться