Я пытаюсь понять, как использовать sphinx4 или pocketsphinx с английской моделью voxforge, но не могу Я пробовал читать страницы документов (например, эту http://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.html ), но мне это не помогло.
Мне нужен исполняемый файл, в котором я могу указать, какую модель использовать и какой аудиофайл использовать в качестве источника, и распечатать исполняемый файл - это лучшее предположение о том, что говорит голос на записи.
Мне повезло: pocketsphinx_continuous -infile record.wav 2> / dev / null
Но он прерывается до того, как весь аудиофайл будет расшифрован, и в модели по умолчанию есть несколько слов для создания читаемого текста из аудио.
Я скомпилировал и протестировал демоверсии в пакете с исходным кодом sphinx4, но все примеры, кажется, содержат несколько слов и нуждаются в модели, такой как voxforge, чтобы быть полезной для меня.
Как я могу это настроить?