Для любого не знакомого с программой SongID Verizon, это - бесплатное приложение, загружаемое через сеть VCast Verizon. Это слушает песню в течение 10 секунд в любой точке во время песни и затем отправляет эти данные некоторому всезнающему алгоритмическому зверю, который уничтожает его и отправляет Вам назад все теги ID3 (художник, альбом, песня, и т.д....)
Первые две части и последняя часть просты, но что продолжается во время обработки после того, как зарегистрированный звук отправляется?
Я полагаю, что это должно взять звуковой файл (что формат?), проанализируйте его (как? с какой?) для некоторых ключевых идентификаторов (что они? регулярные атрибуты волновых функций? фаза/сдвиг/амплитуда/и т.д.), и проверка это против базы данных.
Все, что я нахожу онлайн о том, как это работает, является чем-то универсальным как то, что я ввел выше.
Этот сервис основан на сложном аудио алгоритме распознавания, комбинирующем усовершенствованную технологию снятия отпечатков пальцев аудио и базу данных больших песен. При загрузке звукового файла он анализируется аудио механизмом. Во время анализа его аудио “цифровой отпечаток” извлечен и определен путем сравнения его с музыкальной базой данных. При завершении этого процесса распознавания информация о песнях с их соответствием вероятностям отображена на экране.
Все эти сервисы работают путем снятия "отпечатка пальца" с аудиоданных на стороне клиента, отправки его на сервер и сравнения с базой данных отпечатков пальцев.
Один из разработчиков Shazam написал чрезвычайно информативный white paper о том, как работает эта технология. Это должно дать вам всю необходимую информацию.