Существует три основных варианта внедрения PDF в HTML-страницу:
Использование тегов HTML iframe, embed и object:
Мольба, На вашем месте, (И я нахожусь в процессе работы над чем-то очень похожим на то, что Вы хотите сделать), я хешировал бы mp3 блок данных. (Извлеките его к необработанным данным сначала и выпишите его к диску, таким образом, Вы знаете то, что Вы имеете дело с). Затем измените тег ID3. Хешируйте свои данные снова. Теперь, если это изменяется, сравните свои два набора необработанных данных и узнайте, ГДЕ это изменилось. Возможности, Вы могли бы переступать через границу где-нибудь. Если я вспоминаю, файлы MP3 запускаются с чего-то как FF F8. Ну, по крайней мере, кадр делает.
Я интересуюсь Вашими результатами, поскольку я все еще пишу весь свой код для контакта с отпечатками пальцев, и т.д., и еще не добрался до фактического хеширования.
Я пытаюсь сделать то же самое. Я использовал MD5 вместо SHA1. Я начал экспортировать контрольные суммы аудио с помощью mp3tag (www.mp3tag.de/en/); затем создал сценарий Perl, похожий на ваш, чтобы сделать то же самое. Затем я удалил все теги из своего тестового файла, и контрольная сумма аудио осталась прежней.
Это сценарий:
Если вы ищете стабильные хэши для самой музыки, вы можете посмотреть libOFA . Ваши текущие методы дадут вам разные результаты, потому что форматы могут иметь встроенные теги. Также, если вы хотите, чтобы два разных файла с одной и той же песней возвращали один и тот же хэш, вам нужно учитывать такие вещи, как битрейт и частота дискретизации.
libOFA, с другой стороны, может дать вам стабильный хеш, который можно использовать между форматами и разными кодировками . Может быть, вы хотите?