Как использовать CMU Sphinx 4 для преобразования речи в текст с английскими моделями voxforge

Я пытаюсь понять, как использовать sphinx4 или pocketsphinx с английской моделью voxforge, но не могу Я пробовал читать страницы документов (например, эту http://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.html ), но мне это не помогло.

Мне нужен исполняемый файл, в котором я могу указать, какую модель использовать и какой аудиофайл использовать в качестве источника, и распечатать исполняемый файл - это лучшее предположение о том, что говорит голос на записи.

Мне повезло: pocketsphinx_continuous -infile record.wav 2> / dev / null

Но он прерывается до того, как весь аудиофайл будет расшифрован, и в модели по умолчанию есть несколько слов для создания читаемого текста из аудио.

Я скомпилировал и протестировал демоверсии в пакете с исходным кодом sphinx4, но все примеры, кажется, содержат несколько слов и нуждаются в модели, такой как voxforge, чтобы быть полезной для меня.

Как я могу это настроить?

10
задан mzjn 31 December 2011 в 14:18
поделиться