Сравнение алгоритмов анализа данных [закрывается]

Question

Сравнение алгоритмов анализа данных [закрывается]

5

задан Max 6 February 2010 в 20:08

3 ответа

Очень сложно сравнивать алгоритмы машинного обучения в целом с точки зрения надежности и точности. Однако можно изучить некоторые из их плюсов и минусов. Ниже я рассмотрю несколько наиболее известных алгоритмов машинного обучения (это никоим образом не является исчерпывающим описанием вещей, просто мое мнение):

Деревья решений: наиболее заметно алгоритм C4.5. У них есть преимущество создания легко интерпретируемой модели. Однако они подвержены переобучению. Существует множество вариантов.

Байесовские сети имеют сильные статистические корни. Они особенно полезны в тех областях, где логический вывод выполняется на основе неполных данных.

Искусственные нейронные сети - широко используемый и мощный метод. Теоретически они могут аппроксимировать любую произвольную функцию. Однако они требуют настройки большого количества параметров (структура сети, количество узлов, функции активации и т. Д.). Также у них есть недостаток, заключающийся в том, что они работают как черный ящик (модель трудно интерпретировать)

Машина опорных векторов, возможно, считается одним из самых мощных методов. Используя знаменитый трюк с ядром, теоретически всегда можно добиться 100% разделимости.В отличие от ИНС они стремятся оптимизировать однозначно решаемую задачу (без локальных минимумов). Однако они могут потребовать значительных вычислительных ресурсов и их трудно применить к большим наборам данных. SVM - определенно открытая область исследований.

Кроме того, существует класс алгоритмов метаобучения, таких как методы ансамблевого обучения, такие как пакетирование, усиление, суммирование и т. Д. Они сами по себе не являются законченными, а скорее используются как способы улучшения и комбинирования других алгоритмов.

В конце я должен упомянуть, что ни один алгоритм в целом лучше другого, и что решение о том, какой выбрать, в значительной степени зависит от области, в которой мы находимся, данных и их предварительной обработки среди многих других факторов.

3

ответ дан 18 December 2019 в 14:45

ROC кривые оказались полезными для оценки машинных методов обучения и, в частности, для сравнения и оценки различных алгоритмов классификации. Полезным может оказаться введение в анализ УХОП .

2

ответ дан 18 December 2019 в 14:45

Другие вопросы по тегам:

algorithm data-mining

Сравнение алгоритмов анализа данных [закрывается]

3 ответа

Похожие вопросы: