Обнаружьте и запишите звук с Python

Я использую эту программу для записи звука в Python:

Обнаружьте и запишите аудио в Python

Я хочу изменить программу, чтобы начать записывать, когда звук обнаруживается входом звуковой карты. Вероятно, должен сравнить входной уровень звука в блоке, но как делают это?

11
задан Community 23 May 2017 в 12:02
поделиться

3 ответа

Как это сделать, указано в предоставленной вами ссылке:

print "* recording"
for i in range(0, 44100 / chunk * RECORD_SECONDS):
    data = stream.read(chunk)
    # check for silence here by comparing the level with 0 (or some threshold) for 
    # the contents of data.
    # then write data or not to a file

Вы должны установить пороговую переменную и сравнивать ее со средним значением (амплитудой) или другим связанным параметром в данных каждый раз, когда они считываются в цикле.

У вас может быть два вложенных цикла, первый для запуска записи, а другой для непрерывного сохранения фрагментов звуковых данных после этого.

1
ответ дан 3 December 2019 в 07:11
поделиться

Вы можете попробовать что-то вроде этого:

на основе этого вопроса / ответа

# this is the threshold that determines whether or not sound is detected
THRESHOLD = 0

#open your audio stream    

# wait until the sound data breaks some level threshold
while True:
    data = stream.read(chunk)
    # check level against threshold, you'll have to write getLevel()
    if getLevel(data) > THRESHOLD:
        break

# record for however long you want
# close the stream

Вы, вероятно, захотите поиграть с размер блока и пороговые значения, пока вы не добьетесь желаемого поведения.

Редактировать:

Вы можете использовать встроенный пакет audioop , чтобы найти среднеквадратичное значение (RMS) выборки, что обычно является способом получения уровня.

import audioop
import pyaudio

chunk = 1024

p = pyaudio.PyAudio()

stream = p.open(format=pyaudio.paInt16,
                channels=1,
                rate=44100,
                input=True,
                frames_per_buffer=chunk)

data = stream.read(chunk)

rms = audioop.rms(data, 2)  #width=2 for format=paInt16
11
ответ дан 3 December 2019 в 07:11
поделиться

Обнаружение отсутствия тишины обычно выполняется с использованием среднеквадратичного (RMS) некоторого фрагмента звука и сравнивая его с некоторым пороговым значением, которое вы установили (значение будет зависеть от того, насколько чувствителен ваш микрофон, и других вещей, поэтому вам придется его отрегулировать).Кроме того, в зависимости от того, насколько быстро вы хотите, чтобы микрофон обнаруживал записываемый звук, вы можете уменьшить размер фрагмента или вычислить RMS для перекрывающихся фрагментов данных.

5
ответ дан 3 December 2019 в 07:11
поделиться
Другие вопросы по тегам:

Похожие вопросы: