Можно ли настроить CMU Sphinx на распознавание ~200 слов

У меня есть клиент, которому нужно приложение для Android, способное распознавать голосовые команды. Насколько я понимаю, встроенная функция преобразования голоса в текст фактически посылает данные на серверы Google, которые затем отправляют обратно текстовый перевод. Это большая проблема, так как голосовые данные чрезвычайно конфиденциальны (если только данные не шифруются при отправке в Google и обратно - но я сомневаюсь, что они шифруются).

Есть два варианта, о которых я могу думать. Первый - преобразовать речь в текст на Android, хотя это кажется чрезвычайно дорогой операцией. Вторая возможность заключается в том, чтобы локальный сервер преобразовывал данные для меня (я мог бы шифровать голосовые данные и перевод при отправке и получении). Может ли это сделать CMU Sphinx? Стоит отметить, что у меня также будет доступ к серверу Asterisk, который, возможно, поможет в этом (я не знаю).

В действительности, должно быть всего ~200 слов, которые нужно будет распознать. Я бы предпочел открытые/бесплатные программные решения, однако я также открыт для коммерческого решения (возможно, FlexT9). В идеале, я могу отправить аудиопоток куда-то, получить обратно строку, которая является текстом, и затем я могу разобрать и сделать другие вещи с этой строкой.

В прошлом я не занимался андроидами или разработкой распознавания речи, поэтому я надеюсь, что кто-то сможет хотя бы направить меня в нужном направлении. Спасибо!

7
задан Raedwald 30 September 2013 в 12:03
поделиться