Я интересуюсь приобретением знаний о, и запись системы, которая извлечет функции из звуковых файлов (mp3, wav, и т.д.), который может позже использоваться для любой цели. В будущем я надеюсь использовать его для записи некоторого программного обеспечения для музыкального подобия.
Есть ли какие-либо библиотеки, которые существуют для помощи? Я знаю о libxtract, но не использовал его.
Кроме того, есть ли какой-либо низкий уровень c/c ++ библиотеки, которые были бы хороши с контактом с аудиопотоками? У меня просто нет опыта в этой области.
Спасибо за справку,
Eric
Marsyas представляет собой очень полный фреймворк, который также предлагает извлечение звуковых функций.
Он написан на C++ и предлагает механизм "патча", который позволяет подключать предопределенные компоненты.
.
Фреймворк поставляется с несколькими примерами
.
Взгляните на источники, чтобы узнать, как создавать пользовательские экстракторы
.
Инструмент командной строки bextract
, который поставляется вместе с Marsyas, может извлекать:
Marsyas поддерживает несколько платформ, включая Windows, Linux и Mac OS X (я также видел статью, в которой упоминалось, что он также работает на iPhone)
.Сначала почитайте о БПФ и цифровой обработке сигналов. Затем получите учебник по распознаванию речи, так как это основано именно на том, что вы хотите сделать - механизм распознавания речи извлекает "особенности" из звука, чтобы определить, о чем идет речь.
Я обнаружил, что Кепстральные Коэффициенты делают отличные "особенности" в смысле машинного обучения.
.