Обнаружьте дублирующиеся файлы MP3 с различными скоростями передачи и/или различными тегами ID3?

Если beginTime является меткой времени Unix, попробуйте extract(hour from FROM_UNIXTIME(s.last_login) ), надеюсь, я смогу вам помочь.

12
задан Peter Mortensen 24 March 2010 в 20:38
поделиться

6 ответов

Тот же самый вопрос, что люди в старом AudioScrobbler и в настоящее время в MusicBrainz продолжали работать с тех пор давно. В настоящее время проектом Python, который может помочь в Ваших поисках, является Picard, который отметит звуковые файлы (не только файлы MPEG 1 Уровня 3) с GUID (на самом деле, несколько из них), и с тех пор, соответствие тегам довольно просто.

Если Вы предпочитаете делать это, поскольку собственный проект, libofa мог бы помочь.

15
ответ дан 2 December 2019 в 04:53
поделиться

Как другие сказал, простые контрольные суммы не обнаружат дубликаты с различными скоростями передачи или тегами ID3. То, в чем Вы нуждаетесь, является аудио алгоритмом цифрового отпечатка. Комплект Python Audioprocessing имеет такой алгоритм, но я ничего не могу сказать о том, насколько надежный это.

http://rudd-o.com/new-projects/python-audioprocessing

4
ответ дан 2 December 2019 в 04:53
поделиться

Для проблем тега Picard может действительно быть очень хорошей ставкой. Если, определив два потенциально дубликаты файлов, что Вы хотите, должны извлечь информацию о скорости передачи от них, взглянуть на mp3guessenc.

3
ответ дан 2 December 2019 в 04:53
поделиться

Я не думаю, что простые контрольные суммы будут когда-либо работать:

  1. Теги ID3 будут влиять на md5
  2. Различные кодеры закодируют ту же песню различные пути - таким образом, контрольные суммы будут отличаться
  3. Различные скорости передачи произведут различные контрольные суммы
  4. Перекодирование mp3 к другой скорости передачи будет, вероятно, звучать ужасным и будет, конечно, отличаться от исходного аудио, сжатого за один шаг.

Я думаю, что необходимо будет сравнить теги ID3, длину песни и имена файлов.

2
ответ дан 2 December 2019 в 04:53
поделиться

Перекодирование в той же скорости передачи не будет работать, на самом деле это может сделать вещи хуже как транскодирующий (именно это перекодирование в различных скоростях передачи называют), собирается изменить природу сжатия, Вы повторно сжимаетесь, уже сжатый файл собирается привести к существенно отличающемуся файлу.

Это немного вне моей лиги, но я приблизился бы к проблеме путем рассмотрения волнового спектра MP3. Или путем преобразования MP3 в uncompressd .wav или возможно просто выполнив анализ самого файла MP3. Должна быть библиотека там для этого. Просто слово предупреждения, это - дорогая операция.

Другая идея, используйте ReplayGain для сканирования файлов. Если они - та же песня, они должны быть, отмечены с тем же усилением. Это будет только работать над той же самой песней из того же самого альбома. Я знаю о нескольких случаях, были переиздания, обновляются в более высоком объеме, таким образом изменяя replaygain.

Править:
Вы могли бы хотеть проверить http://www.speech.kth.se/snack/, который, по-видимому, может сделать визуализацию спектрограммы. Я воображаю любую библиотеку, которая может, визуальная спектрограмма может помочь Вам сравнить их.

Эта ссылка от официальной страницы Python может также быть полезной.

2
ответ дан 2 December 2019 в 04:53
поделиться

Я ищу нечто подобное и нашел это:
http://www.lastfm.es/user/nova77LF/journal/2007/10/12/4kaf_fingerprint_ (command_line) _client

Надеюсь на это помогает.

1
ответ дан 2 December 2019 в 04:53
поделиться
Другие вопросы по тегам:

Похожие вопросы: