Как преобразовать изображение в сегменты символов?

Часто в процессе оптического распознавания символов файл изображения фактически разрезается на сегменты, и каждый символ распознается как сегмент. Например,Unsegmented text as image

нужно преобразовать во что-то вроде Image in which text has been segmented and is ready for OCR

Кроме того, существует ли для этой цели какой-либо алгоритм для азиатских языков, таких как телугу? Если нет, то как это сделать для английского языка?

15
задан hippietrail 8 September 2014 в 03:55
поделиться