Извлечение функции аудио

Question

Извлечение функции аудио

Я интересуюсь приобретением знаний о, и запись системы, которая извлечет функции из звуковых файлов (mp3, wav, и т.д.), который может позже использоваться для любой цели. В будущем я надеюсь использовать его для записи некоторого программного обеспечения для музыкального подобия.

Есть ли какие-либо библиотеки, которые существуют для помощи? Я знаю о libxtract, но не использовал его.

Кроме того, есть ли какой-либо низкий уровень c/c ++ библиотеки, которые были бы хороши с контактом с аудиопотоками? У меня просто нет опыта в этой области.

Спасибо за справку,

Eric

23

audio fft feature-extraction

задан Thomas Zoechling 30 December 2009 в 11:22

2 ответа

Сначала почитайте о БПФ и цифровой обработке сигналов. Затем получите учебник по распознаванию речи, так как это основано именно на том, что вы хотите сделать - механизм распознавания речи извлекает "особенности" из звука, чтобы определить, о чем идет речь.

Я обнаружил, что Кепстральные Коэффициенты делают отличные "особенности" в смысле машинного обучения.

.

3

ответ дан 21 July 2019 в 11:47

Другие вопросы по тегам:

audio fft feature-extraction

Похожие вопросы:

score 15 · Accepted Answer

Marsyas представляет собой очень полный фреймворк, который также предлагает извлечение звуковых функций.
Он написан на C++ и предлагает механизм "патча", который позволяет подключать предопределенные компоненты.
. Фреймворк поставляется с несколькими примерами
. Взгляните на источники, чтобы узнать, как создавать пользовательские экстракторы
. Инструмент командной строки bextract, который поставляется вместе с Marsyas, может извлекать:

MFCCs
Zero Crossing Rate
Spectral Centroid
...

Marsyas поддерживает несколько платформ, включая Windows, Linux и Mac OS X (я также видел статью, в которой упоминалось, что он также работает на iPhone)

.