У кого-либо есть какая-либо идея о какой-либо недавней работе, сделанной на оптическом распознавании символов для индийских сценариев с помощью современных методов Машинного обучения? Я знаю о некотором исследовании, сделанном в ISI, Калькутте, но ничто нового не подошло за прошлые 3-4 года насколько я знаю, и OCR для Devanagari печально недостает!
Это, безусловно, слишком старое, чтобы быть полезным, но это круто: видео ИНГАЛКИ, говорящих на Sanskrit и OCR. ( Daniel HH Ingalls, SR. , санскритский профессор и переводчик, и его сын Дэн Ингаллы , компьютерный ученый, связанный с SmallTalk и т. Д.) Первая половина - это ингаллы SR. Описание проекта Автоматически анализируют текст, а второе - в Ingalls JR. Описание того, как он реализовал OCR для Sanskrit с нуля.
FYI: В New York Times за 2003 год есть статья , в которой упоминается инструмент под названием ILT .