Я начинаю с аудиозаписи с помощью своего смартфона Android.
Я успешно сохранил голосовые записи в файл PCM . Когда я анализирую данные и распечатываю 16-битные значения со знаком, я могу создать график, подобный приведенному ниже. Однако я не понимаю значения амплитуды по оси Y.
В каких именно единицах измерения амплитуды? Значения подписаны 16-битными, поэтому они должны находиться в диапазоне от -32K до +32K. Но что представляют собой эти ценности? Децибелы?
Если я использую 8-битные значения, тогда значения должны находиться в диапазоне от -128 до +128. Как это будет соотнесено с объемом / "громкостью" из 16-битных значений? Вы бы просто использовали отображение квантования 16: 1?
Почему здесь отрицательные значения? Я думаю, что полное молчание приведет к значениям 0.
Если кто-нибудь может указать мне на веб-сайт с информацией о том, что записывается, я был бы признателен. Я обнаружил веб-страниц в формате файла PCM, но не нашел значения данных.