Как начать с речью в тексте?

Кажется, что синтаксически более простой способ и, следовательно, легче запомнить, в отличие от предлагаемых решений. Я предполагаю, что столбец называется «мета» в dataframe df:

df2 = pd.DataFrame(df['meta'].str.split().values.tolist())
10
задан jeremiahd 18 August 2008 в 17:12
поделиться

5 ответов

Это - ОГРОМНЫЕ вопросы, я не знал бы, как начать... Таким образом позвольте мне просто попытаться дать Вам правильные "условия", таким образом, можно совершенствовать поиски:

Во-первых, поймите, что Распознавание речи является разнообразным и сложным предметом, и оно имеет много различных приложений. Люди склонны отображать этот домен на первую вещь, которая прибывает к их голове (обычно, который был бы компьютерами, понимающими, как что Вы говорите в системах IVR). Таким образом, сначала позволяет distinguise понятие в основные категории:

Человек к машине: Приложения, которые имеют дело с пониманием, что говорит человек, но человек знает, что говорит с машиной и грамматикой, очень ограничены. Примеры

  • Компьютерная автоматизация
  • Специализированный: Пилоты, автоматизирующие некоторые средства управления, например (шум огромная проблема)
  • IVR (Интерактивный Речевой Ответ) системы как Google 411 или когда Вы называете банк и компьютер с другой стороны, говорят, "скажите 'сервис' для получения обслуживания клиентов"

от человека к человеку (Спонтанная речь): Это - большая, более сложная проблема. Здесь мы можем также разломать его на различные приложения:

  • Центр обработки вызовов: разговор между Клиентом Агента, позвоните качеству, сжатому
  • Аналитика: радио-/телефонные/живые переговоры между 2 или больше людьми

Теперь, Речь в тексте не то, что необходимо говорить, что Вы заботитесь о. То, о чем Вы заботитесь, решает проблему. Различные технологии используются для решения различных проблем. См. обзор здесь некоторых из них. для суммирования другими подходами является Фонетическая транскрипция, LVCSR и прямой базирующийся.

Кроме того, интересуются Вы тем, чтобы быть доктором философии позади технологии? Вам был бы нужен Masters эквивалентная Обработка сигналов вовлечения и вероятно доктор философии, чтобы быть лезвием. В этом случае Вы будете работать на компанию, которая разрабатывает фактический речевой механизм. Компании как Нюанс и IBM являются большими, но также и Phillips и другие стартапы существуют.

С другой стороны, если Вы захотите быть реализовывающими приложениями, то Вы не будете работать над механизмом, но работать над создаванием приложения, которые ИСПОЛЬЗУЮТ механизм. Хорошая аналогия я думаю, является формой индустрия компьютерных игр: Вы разрабатываете графический механизм (как механизм Крика) или работаете над одной из нескольких сотен игр, все использование тот же графический механизм?

Не понимайте меня превратно, существует много для работы над качеством поиска также за пределами IBM/нюанса мира. Механизм обычно очень открыт, и существует большая алгоритмическая тонкая настройка, которая будет сделана, который может существенно влиять на производительность. Каждое бизнес-приложение имеет различные ограничения и функцию стоимости/преимущества, таким образом, можно сделать эксперименты, много лет создающие лучше основанные на распознавании речи приложения.

еще одна вещь: в целом Вы также хотели бы иметь хороший фон статистики ниже в стеке, которым Вы хотите быть.

В данный момент я главным образом интересуюсь способностью создать приложения, которые позволяют автоматизацию

Хороший, мы сходимся здесь... Затем у Вас нет интереса к "Речи в тексте". То, что модные словечки берут Вас к миру полной записи, месту, Вы не должны переходить в. Необходимо фокусировать на некоторых из большего количества технологий Человека к машине как Речь XML, и те использовали в системах IVR (Нюанс является крупнейшим плеером там),

8
ответ дан 3 December 2019 в 22:40
поделиться

Я определенно рекомендовал бы забрать книгу или два, если Вы плохо знакомы с полем. У меня нет опыта в поле, таким образом, я не могу предоставить рекомендацию. Если Вы находитесь все еще в колледже (или все еще имейте тесную связь), необходимо узнать, может ли какой-либо из преподавателей предоставить рекомендацию.

Обзор, который Вы связали, является, вероятно, превосходным ресурсом, также. Я уверен, что с 1996 были продвижения, но основы вряд ли существенно изменятся. Если бы обзор правильно написан, то это определенно стоило бы Вашего времени для чтения его.

3
ответ дан 3 December 2019 в 22:40
поделиться

Поскольку OS X проверяет это: OS X Speech Technologies

Поскольку Windows проверяет это: Microsoft Speech API

2
ответ дан 3 December 2019 в 22:40
поделиться

Я работал с продуктом IBMs ViaVoice. Это имеет хороший ASR (автоматизированное распознавание речи) механизм и хороший механизм синтеза речи по тексту.

Не очень хорошие веб-сайты, но это - ссылка для Встроенной версии http://www-01.ibm.com/software/voice/support/

Это - агностик платформы, хотя, и все работает через архитектуру MVC с помощью vxml вариант xml в речевых целях.

2
ответ дан 3 December 2019 в 22:40
поделиться

Для какой платформы Вы нацелены?. Существует Microsoft Speech APIs, которую можно использовать если для окон.

0
ответ дан 3 December 2019 в 22:40
поделиться
Другие вопросы по тегам:

Похожие вопросы: