Идентификация в реальном времени неречевого, немузыкального звука из непрерывного микрофонного потока

Question

Идентификация в реальном времени неречевого, немузыкального звука из непрерывного микрофонного потока

Я хочу регистрировать события, соответствующие определенному звуку, например, хлопку дверцы машины или, возможно, тостеру извлечение тоста.

Система должна быть более сложной, чем "lou d детектор шума »; он должен уметь отличать этот конкретный звук от других громких шумов.

Идентификация не обязательно должна иметь нулевую задержку, но процессор должен поддерживать непрерывный поток входящих данных с микрофона, который всегда включен.

Существенно ли отличается эта задача от распознавания речи, или я могу использовать библиотеки / инструменты распознавания речи для идентификации этих неречевых звуков?
Учитывая требование, что мне нужно сопоставить только один звук (в отличие от сопоставления среди библиотеки звуков), могу ли я сделать какие-то специальные оптимизации?

Этот ответ указывает на то, что соответствующий фильтр будет подходящим, но я не знаю деталей. Я не верю, что простая взаимная корреляция данных звуковой волны между образцом целевого звука и потоком микрофона будет эффективной из-за вариаций целевого звука.

Мой вопрос также похож на этот , который не получил особого внимания.

8

java python real-time pattern-recognition audio-fingerprinting

задан Community 23 May 2017 в 11:46

0 ответов

Другие вопросы по тегам:

java python real-time pattern-recognition audio-fingerprinting

Идентификация в реальном времени неречевого, немузыкального звука из непрерывного микрофонного потока

0 ответов

Похожие вопросы: