Verizon SongID - Как это программируется?

Для любого не знакомого с программой SongID Verizon, это - бесплатное приложение, загружаемое через сеть VCast Verizon. Это слушает песню в течение 10 секунд в любой точке во время песни и затем отправляет эти данные некоторому всезнающему алгоритмическому зверю, который уничтожает его и отправляет Вам назад все теги ID3 (художник, альбом, песня, и т.д....)

Первые две части и последняя часть просты, но что продолжается во время обработки после того, как зарегистрированный звук отправляется?

Я полагаю, что это должно взять звуковой файл (что формат?), проанализируйте его (как? с какой?) для некоторых ключевых идентификаторов (что они? регулярные атрибуты волновых функций? фаза/сдвиг/амплитуда/и т.д.), и проверка это против базы данных.

Все, что я нахожу онлайн о том, как это работает, является чем-то универсальным как то, что я ввел выше.

От audiotag.info

Этот сервис основан на сложном аудио алгоритме распознавания, комбинирующем усовершенствованную технологию снятия отпечатков пальцев аудио и базу данных больших песен. При загрузке звукового файла он анализируется аудио механизмом. Во время анализа его аудио “цифровой отпечаток” извлечен и определен путем сравнения его с музыкальной базой данных. При завершении этого процесса распознавания информация о песнях с их соответствием вероятностям отображена на экране.

6
задан MPelletier 30 April 2012 в 00:38
поделиться

1 ответ

Все эти сервисы работают путем снятия "отпечатка пальца" с аудиоданных на стороне клиента, отправки его на сервер и сравнения с базой данных отпечатков пальцев.

Один из разработчиков Shazam написал чрезвычайно информативный white paper о том, как работает эта технология. Это должно дать вам всю необходимую информацию.

5
ответ дан 17 December 2019 в 04:43
поделиться
Другие вопросы по тегам:

Похожие вопросы: