7
ответов

Какой язык использовать для записи Программного обеспечения для распознавания речи?

Я хочу записать основное Программное обеспечение для распознавания речи, которое может преобразовать речь для отправки текстовых сообщений. Я хотел знать, какой язык больше всего подходит писать такое программное обеспечение. Подходит Java для этого задан
вопрос задан: 20 March 2009 15:46
4
ответа

C#: запишите файл WAV для отправки текстовых сообщений (речь в тексте) с Системой. Речевые пространства имен

Как Вы используете речевые классы пространства имен.NET для преобразования аудио в файле WAV к текстовой форме, которую я могу отобразить на экране или сохранить в файл? Я ищу некоторые учебные образцы. ОБНОВЛЕНИЕ...
вопрос задан: 28 November 2009 13:31
3
ответа

Как пойти о том, чтобы произносить нетренированную речь в текстовом преобразователе?

У меня есть серьезное к глубокой глухоте с очень раннего возраста, но к счастью я могу говорить как нормальный человек. Вербальная коммуникация всегда была трудной для меня из-за моего распознавания речи, которому повреждают...
вопрос задан: 6 November 2011 01:34
2
ответа

записать / сохранить аудио с целью распознавания голоса

Прежде чем задать этот вопрос, я проверил все потоки stackoverflow, связанные с этой проблемой, без какого-либо успеха, поэтому, пожалуйста, не отвечайте со ссылками на другие темы :) Я хочу сохранить / записать ...
вопрос задан: 29 December 2017 22:09
2
ответа

Серверная речь для отправки текстовых сообщений

Я пытаюсь установить сторону сервера механизма распознавания речи. (не коммерческий предпочтенный, так как это только для экспериментирования) идея состоит в том, чтобы позволить пользователю говорить что-то с веб-сайта затем безотносительно...
вопрос задан: 30 April 2010 06:13
2
ответа

Система. Речь. Распознавание выбирая профиль распознавания

Кто-либо знает, как изменить профили распознавания из приложения.NET? Я пишу приложение.NET, которое делает распознавание речи с помощью возможностей, найденных в Системе. Речь....
вопрос задан: 25 January 2010 19:40
2
ответа

Есть ли программное обеспечение что выходная речь в тексте на Фонологическом уровне?

Там какое-либо программное обеспечение там способно к взятию звуковых файлов и выводу фонологического текста (IPA)? Я понимаю, что большая часть программного обеспечения там берет его прямо на язык, но там один...
вопрос задан: 23 October 2009 04:41
2
ответа

приложение для iPhone › Добавляет распознавание речи? [закрытый]

Я хотел бы создать приложение, которое использует распознавание речи. Я видел, что крупные компании как Google и т.д. реализуют эту опцию, но мне любопытно на предмет выполнения его на уровне запуска. Кто-либо изучил это?...
вопрос задан: 2 June 2009 22:50
2
ответа

Как я преобразовываю речь для отправки текстовых сообщений?

Как я мог взять MP3 и преобразовать речь для отправки текстовых сообщений? У меня есть некоторые зарегистрированные примечания от конференции и от встреч (на записи существует единственная речь, которая является моей речью). Я думал, что это будет...
вопрос задан: 29 January 2009 23:32
1
ответ

Ошибка: ошибка аргумента: имя пользователя и пароль требуются, если не задано use_unauthenticated

Я пытаюсь использовать сервис STT с iam apikey. Если я устанавливаю учетные данные IAM, как показано в документации (ниже), я получаю ошибку: имя пользователя и пароль требуются, если только ...
вопрос задан: 27 February 2019 18:23
1
ответ

Маркировка динамиков не соответствует ?? даже если это только 2 динамика

Когда я пытаюсь в демоверсии транскрибировать аудио в текст настолько точно, это вывод в демо. Speaker 0: Hello. Спикер 1: Привет, это Тина. Спикер 0: Да, это кто. это мой вывод ...
вопрос задан: 25 February 2019 06:35
1
ответ

Ошибка с тегом enable_speaker_diarization в Google Cloud Speech to Text

Используя Google-Speech-to-Text, я могу транскрибировать аудиоклип с параметрами по умолчанию. Тем не менее, я получаю сообщение об ошибке при использовании тега enable_speaker_diarization для профилирования отдельных ...
вопрос задан: 20 January 2019 07:46
1
ответ

Аудио файл в текстовое преобразование в функции AWS Lambda

Я пытаюсь преобразовать аудиофайл в текст, используя пакет python speech_regcognition. Но это работает только с очень маленьким аудиофайлом (скажем, 10 секунд). Но я должен конвертировать аудио файл, который ...
вопрос задан: 17 January 2019 07:17
1
ответ

Время ожидания для Android - распознавание речи

Я создаю приложение, которое собирает пользовательские данные с помощью распознавания речи. Моя проблема в том, что для вызова ошибки тайм-аута требуется около 5 секунд, что останавливает речь ...
вопрос задан: 15 January 2019 12:23
1
ответ

Is there a way to use the SpeechRecognizer API directly for speech input?

The Android Dev website provides an example of doing speech input using the built-in Google Speech Input Activity. The activity displays a pre-configured pop-up with the mic and passes its results ...
вопрос задан: 4 November 2014 21:06
0
ответов

Грамматика в Google Web Region API

Могу ли я улучшить распознавание Google речи API, предоставляя ему список слов (в моем случае запрос пользователя очень предсказуемо), чтобы сделать распознавание более точным?
вопрос задан: 20 August 2019 19:07
0
ответов

Ошибка: невозможно инициализировать экземпляр AVAssetReader с активом по нелокальному URL

То, что я пытался сделать, это извлечь аудиофайл mp3 через его URL-адрес для загрузки в Firebase Storage и передать его в функцию transcribeAudio. Последнее вызывает следующую ошибку: Ошибка домена = ...
вопрос задан: 26 June 2019 23:05
0
ответов

Пип не может найти deepspeech / deepspeech-gpu из версий для Windows

Я пытаюсь установить Deepspeech из Pypi на Windows, я продолжаю сталкиваться с проблемой «Не удалось найти требуемый пакет из версий», хотя мой pip обновлен (19.0.1). Я уже попробовал некоторые ...
вопрос задан: 5 April 2019 17:31
0
ответов

SpeechRecognizer Error 4 ERROR_SERVER - сервер отправляет статус ошибки

Что может означать Google - «ошибка сервера»? Это не особенно полезная ошибка. Кто-нибудь видел эту ошибку раньше? Я публикую код здесь. Код обычно работает нормально и его очень мало ...
вопрос задан: 20 January 2019 10:11
0
ответов

Отправка SILENT-фреймов в IBM Watson для поддержания работоспособности соединения НЕ работает

Я использую службу речи IBM Watson to text для потоковой передачи аудио. Ниже приведены шаги о том, что я делаю. Шаги: Я пытаюсь отправить тихий аудиофайл размером 2 МБ [Тихий аудиофайл размером 2 МБ является wav ...
вопрос задан: 17 January 2019 05:56
0
ответов

Доступность Google Speech to Text API

Я использую API речи для Android и понимаю, что для преобразования речи в текст используется облачный API Google. Мне нужен метод, обеспечивающий доступность этой услуги. Делает ...
вопрос задан: 16 January 2019 10:27
0
ответов

Бесплатный испанский сервис распознавания речи

Есть ли бесплатная служба речевой почты, которая может обрабатывать видео или аудиофайлы на испанском языке и генерировать текст из них? Я хотел бы создать приложение, которое может генерировать речь серии ...
вопрос задан: 13 July 2018 16:58
0
ответов

Речевой язык эмулятора Botframework

Я хочу использовать речь в тексте в эмуляторе Botframework. Я положил «fr-FR» в поле «locale», сразу после моего идентификатора микрофлота & amp; пароль. Речь к тексту отлично работает, но не понимает французский. ...
вопрос задан: 13 July 2018 08:19
0
ответов

API Google Speech - iOS

Я использую API речи Google в iOS. Я использую в Индии все, что говорит на хинди, оно вернет текст на английском языке так же, как и он.? Но в других странах, если говорить на хинди, он вернет текст в ...
вопрос задан: 13 July 2018 07:46
0
ответов

механизм распознавания речи с нефильтрованными / нечистыми результатами

Я ищу механизм распознавания spreech (речь в тексте), которая может выводить нефильтрованные или нечистые результаты. Например. если мой ввод для движка - это устный текст типа «Привет, мистер Смит, эмм, ты ...
вопрос задан: 13 July 2018 07:12
0
ответов

Преобразование речи в текст в эмуляторе: действия для обработки намерения не обнаружены.

Я хочу спросить, как я могу использовать речь в текстовый код на моем эмуляторе. Мои коды работают на реальном устройстве, но не работают на эмуляторе. В сообщении об ошибке говорилось: Не найдено ни одного действия для обработки намерения {act = android
вопрос задан: 29 June 2017 15:12
0
ответов

Преобразование бирманской речи в текст в Android?

Можем ли мы добавить собственный язык для RecognizerIntent? У меня есть много поисковых вопросов, таких как https://stackoverflow.com/questions/2080401/is-there-a-speech-to-text-api-by-google, которые решают мою проблему...
вопрос задан: 23 May 2017 11:51
0
ответов

Сравнение использования распознавания речи в Android :по Intent или по потоку -?

Введение Android предоставляет мне два способа использования распознавания речи. Первый способ — с помощью намерения, как в этом вопросе :Пример намерения. Новая Activity помещается на вершину стека, которая...
вопрос задан: 23 May 2017 11:44
0
ответов

хороший API распознавания речи

Я работаю над проектом колледжа, в котором я использую распознавание речи. В настоящее время я разрабатываю его для Windows 7, и я использую пакет API system.speech, который поставляется вместе с .net, и я делаю ...
вопрос задан: 14 December 2014 22:17
0
ответов

Можно ли настроить CMU Sphinx на распознавание ~200 слов

У меня есть клиент, которому нужно приложение для Android, способное распознавать голосовые команды. Насколько я понимаю, встроенная функция преобразования голоса в текст фактически посылает данные на серверы Google, которые затем отправляют ...
вопрос задан: 30 September 2013 12:03