Надлежащие настройки AVAudioRecorder для записи речи?

Я добавляю использование возможности голосовой заметки AVAudioRecorder, и я должен знать лучшие настройки для устройства записи для записи речи.

К сожалению, я ничего не знаю об аудио до степени, для которой я даже не уверен что условия Google.

В настоящее время я использую следующее, с которого я скопировал где-нибудь для тестирования:

recorderSettingsDict=[[NSDictionary alloc] initWithObjectsAndKeys:[NSNumber numberWithInt:kAudioFormatAppleIMA4],AVFormatIDKey,
                        [NSNumber numberWithInt:44100.0],AVSampleRateKey,
                        [NSNumber numberWithInt: 2],AVNumberOfChannelsKey,
                        [NSNumber numberWithInt:16],AVLinearPCMBitDepthKey,
                        [NSNumber numberWithBool:NO],AVLinearPCMIsBigEndianKey,
                        [NSNumber numberWithBool:NO],AVLinearPCMIsFloatKey,
                        nil];

или:

defaultSettings =     {
    AVFormatIDKey = 1768775988;
    AVLinearPCMBitDepthKey = 16;
    AVLinearPCMIsBigEndianKey = 0;
    AVLinearPCMIsFloatKey = 0;
    AVNumberOfChannelsKey = 2;
    AVSampleRateKey = 44100;
};

Это работает, но я не знаю, оптимально ли это для речи с точки зрения качества, скорости, размер файла и т.д.

Ссылка класса AVAudioRecorder перечисляет много констант настроек, но у меня нет подсказки, которые использовать для речи.

Раскрытие этого, если кто-то знает хорошего "AudioFormats для" ресурса Макета, что я возьму это также. (Note:I've, через Документы Apple и они принимают базу знаний в цифровом аудио, что я не делаю отрядов.)

41
задан TechZen 29 January 2010 в 22:23
поделиться

1 ответ

Вы захотите прочитать раздел Руководство по программированию приложений iPhone под названием «Использование звука в iPhone OS» и аудио-очередь Руководство по программированию служб . ( Изменить: Эти ссылки устарели, Использование звука в ОС iPhone было удалено из текущего Руководства по программированию приложений, но Руководство по программированию служб очереди аудио обновлено и перемещено.)

Большинство звуков в человеческих голосах находятся в среднем диапазоне человеческого слуха. Записанная речь легко понимается даже при оцифровке с очень низкой скоростью передачи данных. Вы можете перебирать голосовую запись, но при этом иметь полезный файл. Следовательно, ваше окончательное использование этих записей будет определять ваши решения относительно этих настроек.

Сначала вам нужно выбрать аудиоформат. Ваш выбор будет определяться тем, что вы хотите делать со звуком после его записи. Ваш текущий выбор - IMA4. Возможно, вам понадобится другой формат, но IMA4 - хороший выбор для iPhone.Это быстрая схема кодирования, поэтому она не будет слишком обременительной для ограниченного процессора iPhone, и обеспечивает сжатие 4: 1, поэтому не занимает слишком много места на диске. В зависимости от выбранного формата вы захотите произвести дополнительные настройки.

Текущая частота дискретизации 44,1 кГц такая же, как и стандартная для аудио компакт-дисков. Если вам не нужна запись с высокой точностью, вам не нужна такая высокая частота, но вы не хотите использовать произвольные частоты. Большинство аудиопрограмм могут распознавать скорости только с определенными шагами, такими как 32 кГц, 24 кГц, 16 кГц или 12 кГц.

Количество каналов установлено на 2 для стерео. Если вы не используете дополнительное оборудование, iPhone имеет только один микрофон, и одного моноканала должно быть достаточно. Это вдвое сокращает ваши потребности в данных.

Три настройки Linear PCM, которые вы используете, похоже, предназначены только для записей в формате Linear PCM. Я думаю, что они не влияют на ваш код, поскольку вы используете формат IMA4. Я недостаточно хорошо знаю формат IMA4, чтобы сказать вам, какие настройки вам нужно сделать, поэтому вам придется провести дополнительное исследование, если вы решите продолжить использовать этот параметр.

90
ответ дан 27 November 2019 в 00:25
поделиться
Другие вопросы по тегам:

Похожие вопросы: