2
ответа

OCR для Devanagari (хинди / язык маратхи / санскрит)

У кого-либо есть какая-либо идея о какой-либо недавней работе, сделанной на оптическом распознавании символов для индийских сценариев с помощью современных методов Машинного обучения? Я знаю о некотором исследовании, сделанном в ISI...
вопрос задан: 8 October 2012 15:20
0
ответов

Объединение символов Деванагари

У меня что-то вроде a = "बिक्रम मेरो नाम हो" Я хочу добиться чего-то вроде [0] = बि а [1] = क्र a [3] = म, но поскольку म занимает 4 байта, а बि - 8 байтов, я не могу добраться до этого прямо. ...
вопрос задан: 1 May 2019 05:53
0
ответов

Как преобразовать массив значений тамильского юникода в тамильскую строку в python с пробелами?

Вот список кодовых точек Unicode для тамильского языка [u'\u0b9a', u'\u0b9f', u'\u0bcd', u'\u0b9f', u'\u0b9a', u'\u0baa', u' \u0bc8', u'\u0b', u'\u0bbf', u'\u0bb2', u'\u0bcd', u'\u0ba8', u'\u0bc7', u'\u0bb1', ...
вопрос задан: 29 January 2013 16:26
0
ответов

есть ли какой-нибудь стеммер для индийского языка [закрыто]

есть ли какие-либо реализации стеммеров для индийских языков, например (хинди, телугу) ....
вопрос задан: 8 October 2012 04:30