Судя по отсутствию ответов, nhocr ЯВЛЯЕТСЯ наиболее точным OCR с открытым исходным кодом для японского языка.
У меня был некоторый опыт исследований и разработок решения ABBYY - FineReader Engine. В то время это была версия 8.1, и я не в курсе их последних изменений. Но в то время это было просто лучшее, что я мог найти для нашего портативного сканера. Я очень рекомендую это.
Кстати, вы можете получить бесплатную версию пакета ABBYY OCR для конечных пользователей при покупке принтера XEROX PE220, с которым он поставляется. Этот принтер лежал у меня на столе несколько лет. В комплекте с ним должны быть другие принтеры. Xerox также сделала ставку на их OCR.
Сам не пробовал, но, возможно, вам стоит взглянуть на тессеракт .
Попробуйте WeOCR . Доступны версия сервера и версия для скачивания.