Открыть исходный код для обнаружения и распознавания голоса

У меня есть 15 аудиозаписей, одна из которых, как мне кажется, содержит старую запись моего разговора с бабушкой. Быстрая попытка найти нужное место не дала результата. Я не хочу слушать 20 часов записи, чтобы найти ее. Местоположение не может быть в начале одной из лент. Похоже, что большая часть контента делится на три категории - в порядке общей длины, сначала самая длинная: тишина, речевое радио и музыка.

Я планирую преобразовать все ленты в цифровой формат, а затем снова поискать запись. Очевидный способ - воспроизвести их все в фоновом режиме, пока я занимаюсь другими делами. Для меня это слишком просто, поэтому: Существуют ли какие-либо библиотеки с открытым исходным кодом или другой код, который позволил бы мне найти в порядке возрастания сложности и полезности:

  1. Немолчные области
  2. Области, содержащие человеческую речь
  3. Области, содержащие мою собственную речь (и речь моей бабушки)

Я предпочитаю Python, Java или C.

При отсутствии ответов, подсказки о поисковых запросах будут признательны, поскольку я ничего не знаю об этом поле.

Я понимаю, что легко мог бы потратить на это больше 20 часов.

24
задан Croad Langshan 22 April 2011 в 18:07
поделиться