записать / сохранить аудио с целью распознавания голоса

Или Lua ... Есть трюки с C / C ++, например, с использованием xor или операций, но с риском переполнения и т. д. Просто делайте это болезненно, с тремя заданиями. Не очень.

24
задан user13267 29 December 2017 в 22:09
поделиться

2 ответа

Я получил этот ответ отсюда, я проверил даты и увидел, что он был опубликован через несколько дней после вашего сообщения, поэтому я решил, что вы его пропустили. Android распознавания речи и аудио записи одновременно

один чувак там говорит:

Я получил решение, которое работает хорошо, чтобы распознавать речь и аудио запись. Здесь ( https://github.com/katchsvartanian/voiceRecognition ) ссылка на простой проект Android, который я создал, чтобы показать работу решения. Кроме того, я поместил несколько экранов печати в проект, чтобы проиллюстрировать приложение.

Я попытаюсь кратко объяснить подход, который я использовал. В этом проекте я объединил две функции: Google Speech API и запись Flac.

Google Speech API вызывается через HTTP-соединения. Майк Пульц (Mike Pultz) дает более подробную информацию об API:

"(...) новый API [Google] является API-интерфейсом для полнодуплексной потоковой передачи. Это означает, что он фактически использует два HTTP-соединения - одно POST запрос на загрузку контента в виде «живого» фрагментированного потока и второй GET-запрос для доступа к результатам, что имеет гораздо больше смысла для более длинных аудиосэмплов или для потокового аудио. »

Однако для этого API требуется получить звуковой файл FLAC для правильной работы. Это заставляет нас перейти ко второй части: Запись Flac

Я реализовал запись Flac в этом проекте путем извлечения и адаптации некоторых фрагментов кода и библиотек из приложения с открытым исходным кодом под названием AudioBoo. AudioBoo использует собственный код для записи и воспроизведения формата flac.

Таким образом, можно записать звук flac, отправить его в Google Speech API, получить текст и воспроизвести только что записанный звук.

Проект, который я создал, имеет базовые принципы для его работы и может быть улучшен для конкретных ситуаций. Чтобы заставить его работать в другом сценарии, необходимо получить ключ Google Speech API, который получается, будучи частью группы Google Chromium-dev. Я оставил один ключ в этом проекте, чтобы показать, что он работает, но в конце концов я его удалю. Если кому-то нужна дополнительная информация об этом, дайте мне знать, потому что я не могу разместить более двух ссылок в этом посте.

3
ответ дан user13267 29 December 2017 в 22:09
поделиться

В прошлый раз, когда я проверял, Google Keep установил эти дополнения:

  • android.speech.extra.GET_AUDIO_FORMAT: audio / AMR
  • android.speech.extra.GET_AUDIO: true

Они не документированы как часть документации Android, поэтому они не составляют API Android. Кроме того, Google Keep не полагается на намерение распознавателя рассмотреть эти дополнения. Было бы неплохо, если бы такие дополнения были популяризированы и задокументированы Google.

Чтобы узнать, какие дополнительные функции устанавливаются в Google Keep при вызове RecognizerIntent, внедрите приложение, которое реагирует на RecognizerIntent, и распечатайте все дополнительные данные, которые оно получает. Вы также можете установить Kõnele ( http://kaljurand.github.io/K6nele/ ), который является реализацией RecognizerIntent. Когда Google Keep запускает Kõnele, нажмите и удерживайте значок настроек в виде гаечного ключа. Это показывает некоторые технические подробности о звонящем, а также включает в себя дополнительные дополнения.

Ответ @Iftah объясняет, как Google Keep возвращает аудиозапись абоненту из RecognizerIntent.

9
ответ дан Kaarel 29 December 2017 в 22:09
поделиться
Другие вопросы по тегам:

Похожие вопросы: