Определение лучшего качества звука

Question

Определение лучшего качества звука

Как можно определить лучшее качество звука в списке звуковых файлов того же аудиоклипа с рассмотрением заголовка звукового файла. Хитрая часть - то, что все файлы прибыли из различных форматов и скоростей передачи и их, где все транскодировали к тому же формату и скорости передачи. Как это может быть сделано эффективно?

11

algorithm audio signal-processing

задан JasonMArcher 27 December 2017 в 00:32

9 ответов

Если я правильно понял, у вас есть куча аудиофайлов, запущенных в разных форматах с разным качеством. Все они были преобразованы в один и тот же формат, поэтому вы не можете использовать заголовок, чтобы определить, какие из них были изначально высокого качества, а какие нет.

Это сложная проблема. Потенциально есть несколько уловок, с помощью которых можно выявить некоторые проблемы с качеством, но обнаружить, скажем, что-то, что было преобразовано из алгоритма сжатия с низким битрейтом, такого как MP3, было бы очень сложно.

Несколько простых приемов:

Проверьте максимальную амплитуду - если она низкая, качество будет плохим.
Измерьте самую высокую частоту - если она низкая, у оригинала могла быть более низкая частота дискретизации.

4

ответ дан 3 December 2019 в 01:20

Я думаю, что ответ отрицания хорош, если предположить, что вы просто пытаетесь оценить набор параметров. К сожалению, вам также необходимо определить функцию сравнения для оцениваемых вами параметров.

Что произойдет, если в двух сжатиях будут применены полосовые фильтры с одинаково большими частотными диапазонами, но один из них допускает более высокие частоты, чем другой. Один из них лучше? Какой?

Ответ, вероятно, зависит от того, какие частоты больше используются в файлах, с которыми вы работаете.

Объективной мерой было бы увидеть, какой файл потерял меньше энтропии . К сожалению, сделать это правильно непросто.

1

ответ дан 3 December 2019 в 01:20

Я не разработчик программного обеспечения (я аудиоинженер), и то, что вы слышите при сжатии с помощью алгоритмов mp3, это: - меньше высоких частот: так что вы можете проверить потерю энергии в высшем диапазоне - искаженное стерео: так что вы можете сделать матрицу Mid/Side, и проверить THD в Side - меньшая фазовая когерентность: возможно, вы можете проверить это с помощью корреляционного измерителя

Надеюсь, это поможет, это трудная задача для компьютера!

9

ответ дан 3 December 2019 в 01:20

Если у вас есть оригинал, вы можете оценить, как он был изменен, оценив передаточную функцию. Вам нужно будет предположить некоторую модель, возможно, начать с фильтра низких частот, добавить некоторое размытие (свертку) и затем запустить оценщик для получения меры качества. Вы можете посмотреть статью в Википедии Estimation_theory

4

ответ дан 3 December 2019 в 01:20

Во-первых, Я не звукоинженер , но я старался не забывать о сжатии звука в целом, потому что у меня большая коллекция mp3, и я хочу поделиться некоторыми мыслями о тема.

Является ли наилучшее качество звука, которое вы ищете, с точки зрения человека? Если это так, вы не можете проводить измерения «объективными средствами», такими как сравнение спектрограмм и тому подобное.

Если спектрограмма уродливая, это не обязательно означает ужасное качество. Важно то, может ли кто-нибудь отличить закодированный файл от исходного источника, проводя слепой тест. Период. Если вы хотите проверить качество закодированной звуковой дорожки, вам необходимо провести слепой тест ABX .

LAME (и все другие MP3, AAC, AC3, DTS, ATRAC ... компрессоров) так называемый перцепционный кодировщик. Он использует некоторые факты о природа восприятия звука человеком. Так что нельзя просто полагаться на спектрограммы для оценки его качества.

Источник

Теперь, если ваши цели основаны на объективных манерах / перспективах, вы можете использовать EAQUAL , что означает «Оценка качества звука»:

Это объективное измерение техника, используемая для измерения качества кодированных / декодированных аудиофайлов (очень похож на PEAQ)

(...)

Однако результаты при использовании объективные методики тестирования все еще безрезультатно и в основном только используется разработчиками кодеков и исследователи.

... или Инструмент статистического анализа Фридмана .

(...) выполняет несколько статистических анализ наборов данных, который особенно подходит для прослушивания данные.

Я не говорю, что анализаторы спектра бесполезны. Вот почему я выложил несколько утилит. Я просто прошу быть осторожным со всеми этими статистическими методами: как однажды сказал кто-то в сообществе Hydrogenaudio , Вы не слушаете глазами. (также проверьте эту ветку, которую я опубликовал, это отличный ресурс). Чтобы действительно доказать качество звука с человеческой точки зрения, вам следует тестировать уши, а не графики.

Это сложная тема, и ИМХО я предлагаю вам поискать специализированное аудио-сообщество, такое как Hydrogenaudio .

8

ответ дан 3 December 2019 в 01:20
поделиться

Я не совсем уверен в этом, но вот хорошее место для начала:

http://en.wikipedia.org/wiki/Signal-to-noise_ratio

Я не думаю, что вы сможете рассчитать SNR по одному сигналу, но если у вас есть набор сигналов, вы можете рассчитать SNR, сравнивая их все.

Внизу страницы есть несколько интересных ссылок, которые также могут предоставить некоторые интересные маршруты, если это невозможно.

Кроме того, я не звукорежиссер, но я немного разбираюсь в обработке сигналов, есть ли способ измерить уровни квантования в аудиосигналах? Возможно, есть на что посмотреть.

1

ответ дан 3 December 2019 в 01:20
поделиться

Новая мера качества восприятия для Bit Rate Reduced Audio http://citeseer.ist.psu.edu/cache/papers/cs/15888/http:zSzzSzwww-ft.ee.tu-berlin.dezSzPublikationenzSzpaperszSzAES1996Copenhagen.pdf/a-new-perceptual-quality.pdf

Алгоритмы перцепционного аудиокодирования осуществляют резкое для достижения высокого усиления кодирования. Компоненты сигнала, которые считаются невоспринимаемыми. не передаются, а шум кодирования формируется спектрально в соответствии с порог маскировки аудиосигнала. Простые показатели качества (например, отношение сигнала отношение сигнал/шум, гармонические искажения), которые не могут отделить эти неслышимые артефакты от слышимых ошибок, не могут использоваться для оценки эффективности таких кодеров.

Для оценки качества перцепционных аудиокодеков, необходимы соответствующие необходимы соответствующие алгоритмы измерения, которые обнаруживают и оценивают слышимые артефакты путем сравнения выходного сигнала кодека с некодированным эталоном. Модель восприятия на основе банка фильтров которая обеспечивает лучшее временное разрешение, чем при использовании БПФ и, таким образом, позволяет более точное моделирование до и после маскировки и более точный анализ огибающих в пределах каждого фильтра канал.

См. также
http://academic.research.microsoft.com/Paper/201987.aspx?viewType=1

1

ответ дан 3 December 2019 в 01:20
поделиться

Если у вас нет оригинального аудио, это, вероятно, потребует много работы; почти наверняка это принципиально невозможно в абсолютном смысле, поскольку вы не сможете определить, какие особенности дорожки являются намеренными, а какие фиктивными. У вас даже могут быть кодировки с разных записей или миксов, и в этом случае простое сравнение в любом случае бессмысленно.

Таким образом, если у вас нет оригинала, лучшее, что вы можете сделать, это эвристический подход, который, вероятно, будет работать достаточно хорошо, но потребует больших усилий для реализации.

Инвестируйте в программное обеспечение для обработки звука и приобретите навыки; используйте их для создания программного обеспечения, позволяющего эвристически определять общие дефекты кодировщика, основываясь только на выходных данных. Такими дефектами могут быть плохая временная локальность звуковых попаданий (предполагаемые большие окна в компрессии), высокая корреляция между левым и правым сигналами, ограниченный частотный диапазон и т.д. (человек, обладающий соответствующим опытом, может сделать вывод о том, что кодировщик не имеет достаточных возможностей для выявления таких дефектов. (человек с соответствующим опытом может перечислить десятки).

Оцените качество звука по каждой эвристике по некоторой скользящей шкале.

Используйте здравый смысл и столько времени+людей для тестирования, сколько у вас есть, чтобы взвесить различные факторы на предмет их значимости. Например, хотя было бы неплохо иметь воспроизведение частот до 24Khz, это не очень важно; с другой стороны, отсутствие резкости может быть более раздражающим.

Если вам повезет, кто-то уже сделал эту работу до вас, потому что это звучит как дорогое предложение.

1

ответ дан 3 December 2019 в 01:20
поделиться

Другие вопросы по тегам:
algorithm audio signal-processing

Похожие вопросы:

129
Факториальные Алгоритмы на различных языках - 21 September 2014 15:40

37
Потребность в предсказуемом случайном генераторе - 9 April 2016 18:25

35
Алгоритм, чтобы определить, содержит ли массив n … n+m? - 18 October 2011 09:22

33
Важные реверсивные пары leetcode time out [duplicate] - 25 October 2014 10:12

32
Расширить случайный диапазон от 1–5 до 1–7 - 14 September 2012 14:54

32
Что студентам нужно преподавать сначала при первом изучении сортировки алгоритмов? [закрытый] - 22 August 2013 20:48

31
O (nlogn) Алгоритм - Находят три равномерно расположенных с интервалами в двоичной строке - 2 June 2012 05:51

score 13 · Accepted Answer

Многие из приведенных здесь ответов относятся к общим измерениям звука, таким как THD + N, SNR и т. Д. Однако они не всегда хорошо коррелируют с человеческим восприятием звуковых артефактов. Методы сжатия звука с потерями обычно работают путем увеличения THD + N и SNR, но стремятся сделать это способами, которые трудно обнаружить человеческим ухом. Более традиционный метод измерения звука может обнаружить пониженное отношение сигнал / шум в определенной полосе частот, но имеет ли это значение, если в соседних полосах так много энергии, что никто никогда не заметит разницы?

Исследовательская статья под названием « Восприятие Измерение качества звука на основе психоакустического представления звука »описывает алгоритм количественной оценки способности человеческого уха обнаруживать слышимые различия, основанный на модели того, как ухо слышит. Он учитывает факторы, которые действительно коррелируют с качеством звука, воспринимаемым людьми. В документ включено исследование, в котором результаты их алгоритмов сравниваются с субъективным двойным слепым тестированием, чтобы дать вам представление о том, насколько хорошо работает их модель.

Я не смог найти бесплатную копию этой статьи, но она должна быть в приличной университетской библиотеке.

Реализация алгоритма потребует некоторых знаний об обработке аудиосигналов в частотной области. Студент с опытом работы с DSP должен уметь его реализовать.Если у вас нет эталонной формы сигнала, вы можете использовать информацию из этого документа для количественной оценки нежелательных артефактов.

Алгоритм будет работать с аудио в формате PCM, предпочтительно с синхронизацией по времени, и, конечно же, не требует знания типа файла или заголовка.