Tesseract OCR: как определить величину ошибки чтения для каждого возвращаемого символа?

Я использую механизм Tesseract OCR в приложении iPhone для чтения определенных числовых полей из фотографий счетов-фактур. Используя предварительную обработку фотографий (адаптивное определение порога, очистка артефактов и т. Д.), Результаты, наконец, довольно точны, но есть еще некоторые случаи, которые я хочу улучшить.

Если пользователь делает снимок в условиях низкой освещенности и там Если на изображении присутствует шум или артефакты, механизм распознавания текста интерпретирует эти артефакты как дополнительные цифры. В некоторых задних случаях он может читать, например, числовая сумма «32,15» евро как «5432,15» евро, и это совсем не способствует окончательному доверию пользователя к продукту.

Я предполагаю, что, если есть внутренняя ошибка чтения механизма OCR связанный с каждым прочитанным символом, он будет выше на цифрах "54" в моем предыдущем примере, поскольку они распознаются по небольшим шумовым пикселям, и если бы у меня был доступ к этим значениям ошибок чтения, я смогу легко отбросить ошибочные цифр.

Известен ли вам какой-либо метод для получения величины ошибки чтения (или любого значения «коэффициента точности») для каждого отдельного символа, возвращаемого механизмом OCR tesseract?

5
задан Fivos Vilanakis 16 August 2011 в 04:48
поделиться