Что я хочу сделать, так это создать API, который переводит человеческую речь в формат IPA (International Phonetic Alphabet ). Мой вопрос в том, где ресурсы о том, как декодировать речь на уровне исходной звуковой волны. Я искал API, но большая часть того, что я нашел, просто переводится прямо на латинский алфавит. Я ищу, чтобы создать что-то более точное в его способности различать вокальную фонетику.