Идентификация в реальном времени неречевого, немузыкального звука из непрерывного микрофонного потока

Я хочу регистрировать события, соответствующие определенному звуку, например, хлопку дверцы машины или, возможно, тостеру извлечение тоста.

Система должна быть более сложной, чем "lou d детектор шума »; он должен уметь отличать этот конкретный звук от других громких шумов.

Идентификация не обязательно должна иметь нулевую задержку, но процессор должен поддерживать непрерывный поток входящих данных с микрофона, который всегда включен.

  • Существенно ли отличается эта задача от распознавания речи, или я могу использовать библиотеки / инструменты распознавания речи для идентификации этих неречевых звуков?
  • Учитывая требование, что мне нужно сопоставить только один звук (в отличие от сопоставления среди библиотеки звуков), могу ли я сделать какие-то специальные оптимизации?

Этот ответ указывает на то, что соответствующий фильтр будет подходящим, но я не знаю деталей. Я не верю, что простая взаимная корреляция данных звуковой волны между образцом целевого звука и потоком микрофона будет эффективной из-за вариаций целевого звука.

Мой вопрос также похож на этот , который не получил особого внимания.

8
задан Community 23 May 2017 в 11:46
поделиться