Распознавание речи серверной стороны [закрывается]

9
задан Nikolay Shmyrev 31 August 2013 в 22:08
поделиться

1 ответ

Существует несколько служб IVR, которые содержат весь сеанс VOIP (телефонный звонок) в виде полного приложения, а не предлагают отдельные транзакции услуг «àla carte». Если бы вы сделали свою программу похожей на вызов VOIP, вы могли бы сделать это с помощью некоторых из этих сервисов.

Voxeo опубликовал список бесплатных (и недорогих) провайдеров IVR-хостинга , предназначенный для разработчиков для ограниченного использования. Неудивительно, что все потребуют регистрации.

Другой возможностью было бы сделать прямой запрос через Vlingo , Twilio или Tropo , поскольку они могут продать вам именно то, что вам нужно.

ОБНОВЛЕНИЕ: 25 июля 2012 г.

AT&T объявила о доступности Speech API на. Вы отправляете ему аудио - он возвращает текст в форматах данных XML или JSON. См. Также сайт разработчика .

ОБНОВЛЕНИЕ: 27 августа 2012 г.

Другая возможность - это Dragon Mobile SDK от Nuance, предназначенный для отдельных разработчиков, которым нужен API, позволяющий потребительским приложениям с речью и / или преобразованием текста в текст. речевые функции.

ОБНОВЛЕНИЕ: 21 сентября 2012 г.

Кажется, появилось несколько новых провайдеров, предлагающих именно то, что вы ищете: образцы речи на входе, текст на выходе.Следующее указано в Программируемом Интернете :

Также обратите внимание, что Loquendo теперь часть Nuance.

ОБНОВЛЕНИЕ: 27 июня 2013 г.

API речи AT&T содержит несколько целевых SDK ( Android , iOS, PhoneGap, Titanium, Windows), некоторые из которых размещены на GitHub . Есть даже исходный код для демонстрации Unity 3D .

ОБНОВЛЕНИЕ: 23 января 2014 г.

OneTok переформулировал свои предложения как SDK для iOS и Android .

По-видимому, продукт Voice Genie был полностью переварен Genesys , так что можно было обнаружить лишь незначительные его следы. Учитывая позиционирование Genesys по отношению к крупным предприятиям, трудно понять, есть ли у них какие-либо предложения для небольших объемов или товаров.

Plumvoice , кажется, расширил свои предложения.

Как и многие другие, Vlingo теперь является частью Nuance.

(Я пытался обновить все неработающие ссылки в исходном ответе.)

ОБНОВЛЕНИЕ: 31 октября 2015 г.

Поддержание этого ответа в актуальном состоянии - задача Сизифа.

Список бесплатных (и недорогих) провайдеров IVR-хостинга Voxeo теперь переименован в AT&T Speech API , что, при полном раскрытии информации, теперь у меня есть существенное участие в нем и как таковое, дисквалифицирует меня. от предоставления ссылок практически на все, не ставя под сомнение мою достоверность.

Тем не менее, на рынке речи / НЛП много игроков. Проявляйте усердие.

ОБНОВЛЕНИЕ: 8 апреля 2016 г.

Итак, теперь Google полностью опрокидывает корзину яблок .

33
ответ дан 4 December 2019 в 06:55
поделиться
Другие вопросы по тегам:

Похожие вопросы: