Самый точный OCR с открытым исходным кодом для рукописных чисел? [закрытый]

6
задан Nicolas Raoul 1 April 2010 в 07:05
поделиться

1 ответ

Из FAQ Tesseract:

Как распознать только цифры?

В версии 2.03 и выше:

Используйте

 TessBaseAPI :: SetVariable ("tessedit_char_whitelist", "0123456789"); 
 

до вызова функции Init или поместите это в текстовый файл с именем tessdata / configs / digits :

 tessedit_char_whitelist 0123456789 
 

, а затем ваша командная строка станет:

 tesseract image.tif outputbase nobatch digits 
 

Предупреждение: До старые и новые переменные конфигурации объединяются, вы должны также иметь параметр nobatch .

Но я думаю, поскольку он был разработан для печатного, а не рукописного текста, точность может пострадать даже только для цифр.

5
ответ дан 17 December 2019 в 04:44
поделиться
Другие вопросы по тегам:

Похожие вопросы: