Я использую случайный лесной mllib pyspark в наборе данных HIGGS (который включает 11000000 экземпляров). Я хочу обучить 100 деревьев с 5 для глубины для каждого дерева. Кроме того, я создаю искру в автономном режиме с 4 узлами (...
Я пытаюсь использовать случайный лесной пакет для классификации в R. Переменные перечисленные Меры по Важности: подразумевайте, что необработанный счет важности переменной x для класса 0 означает необработанный счет важности...
Я работаю над оптимизацией производственного набора данных, который состоит из огромного количества контролируемых параметров. Цель состоит в том, чтобы добиться наилучших настроек этих параметров. Я ознакомился ...
Как я могу пометить целое поле как поле категории без повторной индексации в Pyspark? Например: Категория = [1,5,3,6,7,8] -> искра использует его как числовое поле -> Я хочу, чтобы искра рассматривала их как номинальные ...
Я пытаюсь применить случайный лес к набору данных на R. Мой код: «rf.model & lt; - randomForest (rajkachori $ abc_HSM_123 ~., Data = rajkachori, ntree = 500, na.action = na.exclude) ', но Я получаю ...
Мне нужно провести некоторое моделирование, а в целях отладки я хочу использовать set.seed, чтобы получить тот же результат. Вот пример того, что я пытаюсь сделать: библиотека (foreach)
библиотека (doMC)
registerDoMC (2) ...
Мой код показан ниже. импорт numpy как np импорт pandas как pd импорт matplotlib.pyplot как plt импорт seaborn как sns #% matplotlib inline из подпроцесса import check_output импорт os время импорта ## ...
Я пытаюсь запустить классификатор случайных лесов на несбалансированном наборе данных (~ 1: 4). Я использую метод из imblearn следующим образом: из imblearn.ensemble импортировать BalancedRandomForestClassifier rf = ...
В настоящее время я работаю над вариантом использования с использованием RandomForestRegressor. Чтобы получить данные обучения и тестирования отдельно на основе одного столбца, скажем, Home, кадр данных был разбит на словарь. Почти сделано с ...
У меня есть dataframe (Макро), состоящий из одной зависимой переменной (y) и 19 независимых переменных или признаков (x). Я бы хотел использовать произвольный алгоритм леса для прогнозирования последней переменной y (...
библиотека (randomForest)
rf.model <- randomForest (WIN ~., data = learn) Я хотел бы использовать случайную модель леса, но получаю эту ошибку: Ошибка в na.fail.default (list (WIN = c (2L, 1L, 1L , 2L, 1L, 2L, ...
Я использую классификатор Random Forest для классификации и на каждой итерации я получаю разные результаты. Мой код выглядит следующим образом. input_file = 'sample.csv' df1 = pd.read_csv (input_file) df2 = pd ....
Я просто пытаюсь сделать простой пример RandomForestRegressor. Но при проверке точности я получаю эту ошибку /Users/noppanit/anaconda/lib/python2.7/site-packages/sklearn/metrics/classification.pyc ...
У меня есть pandas dataFrame: результат с 2 столбцами. doy (day_of_year: независимая переменная, значения 1,2,3, .... 365). бронирования (зависимая переменная, 279 числовых значений и 86 значений NaN) Пожалуйста, найдите ...
Я пытаюсь понять, как модуль rfImpute from randomForest работает в R. Стандартный пример документации, использующей набор данных iris, приведен ниже: data (iris) iris.na < - iris ...
Я хочу тренировать модели, используя разные алгоритмы. Например, эта работа: dd = read.arff ("china.arff") model = lm (Effort ~. Data = dd) подогнана (модель) Но следующий код дает NULL для того же самого ...
Что произойдет, если мы не будем использовать выборку подпространства (выбор случайных функций) в алгоритме случайного леса? Будет ли наша модель работать так же, как единое дерево решений? Как производится выборка подпространства ...
Я ищу пакеты R или модели / алгоритмы машинного обучения, такие как randomForest, glmnet, gbdt и т. Д., Которые могут обрабатывать NA, в отличие от игнорирования строки или столбца с любые случаи НС. Я не ...
Есть ли у кого-нибудь пример использования случайных лесов с 2.3.1 API Mat, а не cvMat? В основном у меня есть данные Matrix Mat, состоящие из 1000 строк с элементами 16x16x3 и Matrix Mat ...
Я использую RandomForest пакет в R (R версии 2.13.1, RandomForest версия 4.6-2) для регрессии и заметили значительное смещение в моих результатах: ошибка прогнозирования зависит на стоимости ...
У меня есть тренировочный набор размером 38 МБ (12 атрибутов с 420000 строками). Я использую приведенный ниже фрагмент кода R для обучения модели с использованием randomForest. Это занимает несколько часов для меня. rf.model <- randomForest (...
Я пытаюсь запустить randomForest на большом наборе данных (5000x300). К сожалению, я получаю следующее сообщение об ошибке:> RF <- randomForest (prePrior1, postPrior1 [, 6]
+, ...
На странице справки для randomforest::randomforest()говорится:«classwt -Приоритеты классов. В сумме не должно быть единицы. Игнорируется для регрессии». Может ли настройка параметра classwt помочь, когда у вас тяжелое...
Я хотел бы использовать rfcv для отбраковки неважных переменных из набора данных перед созданием окончательного случайного леса с большим количеством деревьев (, пожалуйста, исправьте и сообщите мне, если это не тот способ использования этого...
Я использовал RandomForest для проблемы регрессии. Я использовал важность (rf, type = 1), чтобы получить% IncMSE для переменных, и одна из них имеет отрицательный% IncMSE. Значит ли это, что эта переменная вредна для ...
Я работаю над документом Rmd, который я хотел бы скомпилировать в html, используя пакет knitr через механизм экспорта HTML, доступный в RStudio. Проблема может быть воспроизведена с кодом ниже: Пример # ...
Я впервые имею дело со случайными лесами, и у меня возникают некоторые проблемы, которые я не могу понять ... Когда я запускаю анализ всего моего набора данных (около 3000 строк), я не получаю никакого сообщения об ошибке. Но ...