Вам следует поискать в Интернете обзорные статьи по интеллектуальному анализу данных.
Вот один из них: Десять лучших алгоритмов интеллектуального анализа данных , который дает ранжирование вместо параллельного. (Хотя, возможно, и так, я еще не просматривал бумагу).
Очень сложно сравнивать алгоритмы машинного обучения в целом с точки зрения надежности и точности. Однако можно изучить некоторые из их плюсов и минусов. Ниже я рассмотрю несколько наиболее известных алгоритмов машинного обучения (это никоим образом не является исчерпывающим описанием вещей, просто мое мнение):
Деревья решений: наиболее заметно алгоритм C4.5. У них есть преимущество создания легко интерпретируемой модели. Однако они подвержены переобучению. Существует множество вариантов.
Байесовские сети имеют сильные статистические корни. Они особенно полезны в тех областях, где логический вывод выполняется на основе неполных данных.
Искусственные нейронные сети - широко используемый и мощный метод. Теоретически они могут аппроксимировать любую произвольную функцию. Однако они требуют настройки большого количества параметров (структура сети, количество узлов, функции активации и т. Д.). Также у них есть недостаток, заключающийся в том, что они работают как черный ящик (модель трудно интерпретировать)
Машина опорных векторов, возможно, считается одним из самых мощных методов. Используя знаменитый трюк с ядром, теоретически всегда можно добиться 100% разделимости.В отличие от ИНС они стремятся оптимизировать однозначно решаемую задачу (без локальных минимумов). Однако они могут потребовать значительных вычислительных ресурсов и их трудно применить к большим наборам данных. SVM - определенно открытая область исследований.
Кроме того, существует класс алгоритмов метаобучения, таких как методы ансамблевого обучения, такие как пакетирование, усиление, суммирование и т. Д. Они сами по себе не являются законченными, а скорее используются как способы улучшения и комбинирования других алгоритмов.
В конце я должен упомянуть, что ни один алгоритм в целом лучше другого, и что решение о том, какой выбрать, в значительной степени зависит от области, в которой мы находимся, данных и их предварительной обработки среди многих других факторов.
ROC кривые оказались полезными для оценки машинных методов обучения и, в частности, для сравнения и оценки различных алгоритмов классификации. Полезным может оказаться введение в анализ УХОП .