Если beginTime является меткой времени Unix, попробуйте extract(hour from FROM_UNIXTIME(s.last_login) )
, надеюсь, я смогу вам помочь.
Тот же самый вопрос, что люди в старом AudioScrobbler и в настоящее время в MusicBrainz продолжали работать с тех пор давно. В настоящее время проектом Python, который может помочь в Ваших поисках, является Picard, который отметит звуковые файлы (не только файлы MPEG 1 Уровня 3) с GUID (на самом деле, несколько из них), и с тех пор, соответствие тегам довольно просто.
Если Вы предпочитаете делать это, поскольку собственный проект, libofa мог бы помочь.
Как другие сказал, простые контрольные суммы не обнаружат дубликаты с различными скоростями передачи или тегами ID3. То, в чем Вы нуждаетесь, является аудио алгоритмом цифрового отпечатка. Комплект Python Audioprocessing имеет такой алгоритм, но я ничего не могу сказать о том, насколько надежный это.
Для проблем тега Picard может действительно быть очень хорошей ставкой. Если, определив два потенциально дубликаты файлов, что Вы хотите, должны извлечь информацию о скорости передачи от них, взглянуть на mp3guessenc.
Я не думаю, что простые контрольные суммы будут когда-либо работать:
Я думаю, что необходимо будет сравнить теги ID3, длину песни и имена файлов.
Перекодирование в той же скорости передачи не будет работать, на самом деле это может сделать вещи хуже как транскодирующий (именно это перекодирование в различных скоростях передачи называют), собирается изменить природу сжатия, Вы повторно сжимаетесь, уже сжатый файл собирается привести к существенно отличающемуся файлу.
Это немного вне моей лиги, но я приблизился бы к проблеме путем рассмотрения волнового спектра MP3. Или путем преобразования MP3 в uncompressd .wav или возможно просто выполнив анализ самого файла MP3. Должна быть библиотека там для этого. Просто слово предупреждения, это - дорогая операция.
Другая идея, используйте ReplayGain для сканирования файлов. Если они - та же песня, они должны быть, отмечены с тем же усилением. Это будет только работать над той же самой песней из того же самого альбома. Я знаю о нескольких случаях, были переиздания, обновляются в более высоком объеме, таким образом изменяя replaygain.
Править:
Вы могли бы хотеть проверить http://www.speech.kth.se/snack/, который, по-видимому, может сделать визуализацию спектрограммы. Я воображаю любую библиотеку, которая может, визуальная спектрограмма может помочь Вам сравнить их.
Эта ссылка от официальной страницы Python может также быть полезной.
Я ищу нечто подобное и нашел это:
http://www.lastfm.es/user/nova77LF/journal/2007/10/12/4kaf_fingerprint_ (command_line) _client
Надеюсь на это помогает.