Извлечение функции аудио

Я интересуюсь приобретением знаний о, и запись системы, которая извлечет функции из звуковых файлов (mp3, wav, и т.д.), который может позже использоваться для любой цели. В будущем я надеюсь использовать его для записи некоторого программного обеспечения для музыкального подобия.

Есть ли какие-либо библиотеки, которые существуют для помощи? Я знаю о libxtract, но не использовал его.

Кроме того, есть ли какой-либо низкий уровень c/c ++ библиотеки, которые были бы хороши с контактом с аудиопотоками? У меня просто нет опыта в этой области.

Спасибо за справку,

Eric

23
задан Thomas Zoechling 30 December 2009 в 11:22
поделиться

2 ответа

Marsyas представляет собой очень полный фреймворк, который также предлагает извлечение звуковых функций.
Он написан на C++ и предлагает механизм "патча", который позволяет подключать предопределенные компоненты.
. Фреймворк поставляется с несколькими примерами
. Взгляните на источники, чтобы узнать, как создавать пользовательские экстракторы
. Инструмент командной строки bextract, который поставляется вместе с Marsyas, может извлекать:

  • MFCCs
  • Zero Crossing Rate
  • Spectral Centroid
  • ...

Marsyas поддерживает несколько платформ, включая Windows, Linux и Mac OS X (я также видел статью, в которой упоминалось, что он также работает на iPhone)

.
15
ответ дан 21 July 2019 в 11:47
поделиться

Сначала почитайте о БПФ и цифровой обработке сигналов. Затем получите учебник по распознаванию речи, так как это основано именно на том, что вы хотите сделать - механизм распознавания речи извлекает "особенности" из звука, чтобы определить, о чем идет речь.

Я обнаружил, что Кепстральные Коэффициенты делают отличные "особенности" в смысле машинного обучения.

.
3
ответ дан 21 July 2019 в 11:47
поделиться
Другие вопросы по тегам:

Похожие вопросы: