Сравнение звуковых файлов, если не абсолютно идентичный

DStream имеет несколько RDD, так как каждый интервал между пакетами является другим RDD. Таким образом, используя transform (), вы получаете возможность применить операцию RDD для всего DStream.

Пример из Spark Docs: http://spark.apache.org/docs/latest/streaming-programming-guide.html#transform-operation

25
задан Tai Squared 22 January 2009 в 22:48
поделиться

4 ответа

статья Википедии об акустическом снятии отпечатков пальцев упоминания много продуктов, включая открытый исходный код libfooid. В основном Вы смотрите на вход в частотную область, принимая грубые уровни относительно небольшое количество полос (скажите 32), чтобы дать Вам строку, которая представляет что-то как 25 мс звука, делая это для целого файла, затем делая fuzzing сравнение тех строк для различных файлов. Это довольно сложно, но потребности, делающие - сравнение фактических образцов не получит Вас нигде как что-то столь же простое, как сдвиг объема на несколько процентов выведет целое соответствие.

13
ответ дан U62 16 October 2019 в 07:03
поделиться

Процесс для сравнения ряда звуков для общих черт называют Аудио На основе содержимого Индексация , Извлечение , и Снятие отпечатков пальцев в исследовании информатики.

Один метод выполнения этого к:

1) Выполнение несколько битов обработки сигналов на каждом звуковом файле, чтобы извлечь функции, такие как подача со временем, спектр частот, автокорреляция, динамический диапазон, переходные процессы, и т.д.

2) Помещенный все функции каждого звукового файла в многомерный массив и вывести каждый многомерный массив в базу данных

3) методы оптимизации Использования (такой как спуск градиента ) для нахождения лучшего соответствия для данного звукового файла в базе данных многомерных данных.

прием к созданию этой работы хорошо - какие функции

существует несколько проектов, которые действительно наполняют как это, включая MusicBrainz, и EchoNest.

Echonest имеет один из самые простые API , я видел в этом пространстве. Очень легкий начать.

P.S. No я не работаю на Echonest, и при этом я не знаю никого, кто работает там.

8
ответ дан Nick Haddad 16 October 2019 в 07:03
поделиться

Одна вещь, которую Вы могли попробовать, который даст Вам довольно достойный цифровой отпечаток файла, берет преобразование Фурье и смотрит на распределение различных частот, существующих в файле. Все еще очень возможно сделать два совсем других звуковых файла, которые имеют то же преобразование Фурье, но это несколько маловероятно, если Ваши файлы прибывают из неизобретенного источника...

2
ответ дан rmeador 16 October 2019 в 07:03
поделиться

Вы могли сравнить два образца образцом файлов WAV и вычислить среднее различие на образец. Для ускорения вещей Вы могли использовать тот же метод, но сравнить каждый 10-й образец или каждый 100-й образец и придумать по существу то же значение (два файла, которые не являются тем же или даже закрываются, будет иметь огромную среднюю разницу на образец).

1
ответ дан MusiGenesis 16 October 2019 в 07:03
поделиться
Другие вопросы по тегам:

Похожие вопросы: