Ресурсы/введения новичка к [закрытым] алгоритмам классификации

16
задан dmcer 1 May 2010 в 23:04
поделиться

3 ответа

Я всегда находил Учебники Эндрю Мура очень полезными. Они основаны на прочной статистической теории и будут очень полезны для понимания статей, если вы решите читать их в будущем. Вот краткое описание:

К ним относятся алгоритмы классификации , такие как деревья решений, нейронные сети, байесовские классификаторы, машины опорных векторов и основанные на регистрах (также известное как непараметрическое) обучение. Они включают в себя алгоритмы регрессии , такие как многомерная полиномиальная регрессия, MARS, локально взвешенная регрессия, GMDH и нейронные сети. И они включают в себя другие операции по добыче данных , такие как кластеризация (смешанные модели, k-среднее и иерархическое), байесовские сети и обучение с подкреплением

9
ответ дан 30 November 2019 в 22:23
поделиться

Обзор машинного обучения

Чтобы получить хороший обзор Ознакомьтесь с видеолекциями курса машинного обучения Эндрю Нг .

Этот курс (CS229), который ведет профессор Эндрю Нг, дает общее введение в машинное обучение и статистическое распознавание образов. Темы включают обучение с учителем, обучение без учителя, теорию обучения, обучение с подкреплением и адаптивный контроль. Также обсуждаются недавние приложения машинного обучения, такие как управление роботами, интеллектуальный анализ данных, автономная навигация, биоинформатика, распознавание речи и обработка текста и веб-данных.

Классификаторы

Что касается классификатора, который вы используете следует использовать, я бы рекомендовал сначала начать с Машины опорных векторов (SVM) для общих прикладных задач классификации.Они обеспечат вам ультрасовременную производительность, и вам действительно не нужно понимать всю теорию, лежащую в основе них, чтобы просто использовать реализацию, предоставляемую таким пакетом, как WEKA.

Если у вас большой набор данных, вы можете попробовать использовать Случайные леса . Также есть реализация этого алгоритма в WEKA, и они обучаются намного быстрее на больших данных. Хотя они менее широко используются, чем SVM, их точность, как правило, соответствует или почти совпадает с точностью, которую вы могли бы получить от них.

4
ответ дан 30 November 2019 в 22:23
поделиться

Ответ , относящийся к руководствам Эндрю Мура, является хорошим . Однако я хотел бы дополнить его, предложив прочитать о необходимости, которая в первую очередь движет созданием многих систем классификации: выявлении причинно-следственных связей. Это актуально для многих задач моделирования, связанных со статистическим выводом.

Лучшим из известных мне ресурсов для изучения причинно-следственных связей и систем классификаторов (особенно байесовских классификаторов) является книга Джудеи Перл «Причинность: модели, рассуждения и выводы» .

6
ответ дан 30 November 2019 в 22:23
поделиться
Другие вопросы по тегам:

Похожие вопросы: