19
ответов

Распознавание текста Google Vision [дубликат]

Я следил за учебником по разработке кодеков google для Google vision api, он отлично работает для меня. Существует метод, называемый ONTAP, когда пользователь кликает экран камеры TexttoSpeech, громко говорит текст. ...
вопрос задан: 23 January 2013 15:36
13
ответов

Программное обеспечение распознавания речи для [закрытых] разработчиков

Хорошо в документах наконец было сказано это, я должен успокоиться на запястье в течение нескольких месяцев. Быть этим, я - Разработчик.NET, это могло закончить мои средства к существованию на некоторое время, что-то, которое я не стремлюсь сделать...
вопрос задан: 2 February 2015 08:47
5
ответов

Использование SpeechSynthesizer для калькулятора в VS C # [дубликат]

Поэтому моя цель здесь - использовать SpeechSynthesizer для программы калькулятора, написанной на C #. Раньше я пытался использовать SpeechSynthesizer. Но на этот раз я немного смущен. Поскольку я должен заставить это говорить ...
вопрос задан: 13 March 2013 16:13
4
ответа

Какой Аудиокодек я должен использовать?

Какой аудиокодек должен я выбирать для моего проекта разработки программного обеспечения C#, где необработанное аудио, которое будет транскодироваться/транспортироваться/использоваться, основано на следующем: Для кодирования Речи только Аудио может быть с
вопрос задан: 3 March 2010 01:35
3
ответа

Чтение исходного кода вслух

После наблюдения этого вопроса я добрался до размышления о различных проблемах, что слепые программисты сталкиваются, и как некоторые из них применимы даже к зрячим программистам. Особенно, проблема...
вопрос задан: 23 May 2017 00:27
2
ответа

Каково различие между Системой. Речь. Распознавание и Microsoft. Речь. Распознавание?

Существует два подобных пространства имен и блоки для распознавания речи в.NET. Я пытаюсь понять различия и когда уместно использовать один или другой. Существует Система. Речь....
вопрос задан: 4 June 2010 19:54
2
ответа

Есть ли программное обеспечение что выходная речь в тексте на Фонологическом уровне?

Там какое-либо программное обеспечение там способно к взятию звуковых файлов и выводу фонологического текста (IPA)? Я понимаю, что большая часть программного обеспечения там берет его прямо на язык, но там один...
вопрос задан: 23 October 2009 04:41
1
ответ

Как сценарий оболочки читает данные в папке пакетного тестирования

Недавно я повторил эксперимент SEGAN на основе TensorFlow0.12.1. Автор предоставляет сценарий оболочки для тестирования (clean_wav.sh), как показано на рисунке ниже: Это оригинальная версия, предоставленная ...
вопрос задан: 17 January 2019 22:22
1
ответ

Время отклика API-интерфейса Cloud Speech слишком велико в php? [Дубликат]

Я использую API облачной речи. Но на PHP слишком много времени для ответа. Я использовал файлы облачной библиотеки речей. Проверьте эту ссылку. https://drizzleecommerce.com/voicesearch_google/ ...
вопрос задан: 19 August 2016 01:09
1
ответ

Дракон программисты NaturallySpeaking

Там должен так или иначе включить Дракона NaturallySpeaking в управляемую событиями программу? Мой босс действительно хотел бы его, если бы я использовал DNS для записи пользовательского голосового ввода, не пишущий это в экран и сохранение...
вопрос задан: 25 September 2014 23:48
1
ответ

Акустическое обучение с помощью Речи API SAPI 5.3

Используя Речь Microsoft API SAPI 5.3 на Vista, как Вы программно делаете акустическое образцовое обучение RecoProfile? Более конкретно, если у Вас есть текстовый файл и звуковой файл пользователя, говорящего...
вопрос задан: 21 March 2011 16:45
1
ответ

Речь api 5.1 GetVoices Microsoft возвращает речь, которая не существует в Windows 7

Я перемещаю от XP до Windows 7 64 бита. Мое приложение, которое я скомпилировал на своей машине XP, работает правильно над XP. Однако, когда я выполняю exe на своей машине W7, список речи, возвращенной GetVoices, как...
вопрос задан: 24 July 2010 17:07
1
ответ

Библиотека для извлечения слов (речь) из аудиопотока?

У меня есть аудиопоток, и я извлек бы слова (речь) из него. Так, например, наличие audio.wav я получил бы 001.wav, 002.wav, 003.wav, и т.д. где каждый XXX.wav является одним словом. Я ищу...
вопрос задан: 5 July 2010 09:02
0
ответов

Python Speaker Recognition [закрыто]

У меня есть аудиофайл, записанный телефонный разговор 2-х человек, который мне нужно разделить голоса 2-х динамиков автоматически. Я новичок в распознавании речи и посмотрел на волновой модуль ...
вопрос задан: 23 October 2019 03:59
0
ответов

некоторые проблемы при загрузке модели и прогноза

Я воспроизвожу эксперимент из статьи: SEGAN: Генераторная состязательная сеть по улучшению речи. Автор разместил код и обученную модель на github: https: //github.com/santi-pdp/segan ....
вопрос задан: 16 January 2019 10:45
0
ответов

Как я могу использовать распознавание речи без раздражающего диалога в телефонах Android

Это возможно без изменения API Android? Я нашел статью об этом. Есть один комментарий, что я должен сделать модификации для Android API. Но там не сказано, как это сделать ...
вопрос задан: 23 May 2017 10:31
0
ответов

Есть ли способ использовать грамматику с HTML 5 speech input API?

Я работаю с HTML 5 speech input API и хочу сообщить серверу, какие ответы он может ожидать от речевого ввода. Есть ли способ задать список возможных входов?
вопрос задан: 7 December 2016 07:16
0
ответов

как я могу изменить пол и возраст голосового синтезатора в C#?

Я хотел бы изменить пол и возраст голоса System.Speech в С#. Например, девочка 10 лет, но не может найти простой пример, который поможет мне настроить параметры.
вопрос задан: 9 November 2016 17:42
0
ответов

хороший API распознавания речи

Я работаю над проектом колледжа, в котором я использую распознавание речи. В настоящее время я разрабатываю его для Windows 7, и я использую пакет API system.speech, который поставляется вместе с .net, и я делаю ...
вопрос задан: 14 December 2014 22:17
0
ответов

API преобразования речи Google в текст для языков, отличных от английского [закрыто]

Существует ли API преобразования речи в текст для языков, отличных от английского? Я знаю API для английского языка (http://developer.android.com/resources/articles/speech-input.html), но хочу уметь распознавать ...
вопрос задан: 27 March 2014 17:12
0
ответов

Как определить говорящего по образцу голоса с помощью Microsoft Speech?

Я использую Microsoft Speech C #API для команд домашней автоматизации. Я хотел бы знать, есть ли способ или встроенный -метод C #для хэширования голосового ввода и распознавания говорящего. Если Алиса или Боб говорят "...
вопрос задан: 5 April 2013 09:59
0
ответов

Использование x-webkit-speech в расширении HTML / JavaScript

Я пытаюсь использовать новую функцию x-webkit-speech в простом расширении HTML / JavaScript в Google Chrome. Я, однако, пробовал и пробовал просмотреть кучу примеров и не могу понять ...
вопрос задан: 27 October 2012 09:01
0
ответов

Может ли ввод с помощью attr «x-webkit-speech» быть на языке, отличном от английского?

В настоящее время Chrome x- Кажется, что webkit-speech хорошо работает только с английским, может ли это быть с другими языками?
вопрос задан: 25 June 2012 07:36
0
ответов

Распознавание речи на Kinect

У меня есть проект по распознаванию. Это работает, но если я использую этот проект как класс и вызываю его методы из другого класса, у меня возникает проблема с исключением в строке: sre = new SpeechRecognitionEngine(ri....
вопрос задан: 19 May 2012 21:49
0
ответов

Есть ли способ оценить сложность произношения слова?

Я пытаюсь собрать коллекцию английских слов, которые трудно произносить. Мне было интересно, существует ли какой-нибудь алгоритм или теория, которые можно использовать, чтобы показать, насколько сложно произносить слово...
вопрос задан: 2 May 2012 21:48
0
ответов

Анализ звука для определения человеческого голоса, пола, возраста и эмоций - какая-либо предшествующая работа с открытым исходным кодом была выполнена?

Есть ли предварительные результаты работа с открытым исходным кодом, проделанная в области «Аудиоанализа» для обнаружения человеческого голоса (скажем, несмотря на некоторый фоновый шум), определения пола говорящего, возможно, определения «нет». ораторов
вопрос задан: 13 April 2012 13:29
0
ответов

Перенаправление всего ввода из Dragon NaturallySpeaking в Python? (Используя Natlink)

В настоящее время я пишу программу искусственного интеллекта, которая получает ввод от Dragon NaturallySpeaking (используя Natlink), обрабатывает его и возвращает устный вывод. Я смог придумать приемник GrammarBase ...
вопрос задан: 31 December 2011 05:54
0
ответов

How can you make the android emulator support speech recognition

I am writing an app which uses android's speech recognition. However my app doesnt run well on the emulator - runs fine on the mobile itself however. On the emulator I get a red error message through ...
вопрос задан: 6 May 2011 20:11
0
ответов

Speech to Text on Android

I am looking to create an app which has Speech to text. I am aware of this kind of ability using the RecognizerIntent: http://android-developers.blogspot.com/search/label/Speech%20Input However - I ...
вопрос задан: 6 May 2011 17:48
0
ответов

Открыть исходный код для обнаружения и распознавания голоса

У меня есть 15 аудиозаписей, одна из которых, как мне кажется, содержит старую запись моего разговора с бабушкой. Быстрая попытка найти нужное место не дала результата. Я не хочу слушать 20 ...
вопрос задан: 22 April 2011 18:07