Мои требования аналогичны этому вопросу , так как этому вопросу уже 3 года. Я повторно отправляю вопрос со специфической для меня информацией, я хочу создать приложение, которое принимает. wav (или любой другой стандартный формат аудиофайла) и преобразует его в текст.
Для распознавания речи я решил использовать sphinx4, я пытаюсь улучшить демонстрацию Transcriber, поставляемую с sphinx. Это хорошо, но это работает только для определенных Грамматика (записывается в файлах .gram и .gxml).
РЕДАКТИРОВАТЬ Чтобы иметь возможность использовать его с английским языком? Пытаюсь настроить с помощью VoxForge_en_0.4. Мой файл config.XML выглядит так: -
- accuracyTracker
- speedTracker
- memoryTracker
- recognizerMonitor
- standardActiveListFactory
- wordActiveListFactory
- wordActiveListFactory
- standardActiveListFactory
- standardActiveListFactory
- standardActiveListFactory
- audioFileDataSource
- dataBlocker
- speechClassifier
- speechMarker
- nonSpeechDataFilter
- preemphasizer
- windower
- fft
- melFilterBank
- dct
- liveCMN
- featureExtraction
- configMonitor
Что-то не так с моей конфигурацией? Пожалуйста, помогите ....