7
ответов

py4j.protocol.Py4JJavaError: Произошла ошибка при вызове o243.trainRandomForestModel. : java.lang.OutOfMemoryError: пространство кучи Java [дубликат]

Я использую случайный лесной mllib pyspark в наборе данных HIGGS (который включает 11000000 экземпляров). Я хочу обучить 100 деревьев с 5 для глубины для каждого дерева. Кроме того, я создаю искру в автономном режиме с 4 узлами (...
вопрос задан: 25 November 2015 11:14
3
ответа

R случайная лесная важность переменной

Я пытаюсь использовать случайный лесной пакет для классификации в R. Переменные перечисленные Меры по Важности: подразумевайте, что необработанный счет важности переменной x для класса 0 означает необработанный счет важности...
вопрос задан: 28 August 2012 13:45
2
ответа

Как получить окончательное уравнение, которое алгоритм Random Forest использует для ваших независимых переменных для прогнозирования вашей зависимой переменной?

Я работаю над оптимизацией производственного набора данных, который состоит из огромного количества контролируемых параметров. Цель состоит в том, чтобы добиться наилучших настроек этих параметров. Я ознакомился ...
вопрос задан: 16 January 2019 10:18
2
ответа

Pyspark конвертирует числовые данные в категорию без значения reindex [duplicate]

Как я могу пометить целое поле как поле категории без повторной индексации в Pyspark? Например: Категория = [1,5,3,6,7,8] -> искра использует его как числовое поле -> Я хочу, чтобы искра рассматривала их как номинальные ...
вопрос задан: 28 May 2016 10:38
2
ответа

Ошибка в eval (predvars, data, env): объект 'abc_East_Zone_123_asd (Tonnes / Kl)' не найден [дубликат]

Я пытаюсь применить случайный лес к набору данных на R. Мой код: «rf.model & lt; - randomForest (rajkachori $ abc_HSM_123 ~., Data = rajkachori, ntree = 500, na.action = na.exclude) ', но Я получаю ...
вопрос задан: 29 January 2016 01:16
1
ответ

Как установить начальное число для случайного моделирования с помощью пакетов foreach и doMC?

Мне нужно провести некоторое моделирование, а в целях отладки я хочу использовать set.seed, чтобы получить тот же результат. Вот пример того, что я пытаюсь сделать: библиотека (foreach) библиотека (doMC) registerDoMC (2) ...
вопрос задан: 31 May 2019 08:23
1
ответ

Получение ошибки с помощью RandomForestRegressor

Мой код показан ниже. импорт numpy как np импорт pandas как pd импорт matplotlib.pyplot как plt импорт seaborn как sns #% matplotlib inline из подпроцесса import check_output импорт os время импорта ## ...
вопрос задан: 27 March 2019 04:34
1
ответ

Случайный лес: балансирующий тестовый набор?

Я пытаюсь запустить классификатор случайных лесов на несбалансированном наборе данных (~ 1: 4). Я использую метод из imblearn следующим образом: из imblearn.ensemble импортировать BalancedRandomForestClassifier rf = ...
вопрос задан: 27 February 2019 17:11
1
ответ

Получить значения функций для словаря данных

В настоящее время я работаю над вариантом использования с использованием RandomForestRegressor. Чтобы получить данные обучения и тестирования отдельно на основе одного столбца, скажем, Home, кадр данных был разбит на словарь. Почти сделано с ...
вопрос задан: 17 January 2019 10:09
1
ответ

Случайный лес в предсказателях R - 19, 1 зависимая переменная

У меня есть dataframe (Макро), состоящий из одной зависимой переменной (y) и 19 независимых переменных или признаков (x). Я бы хотел использовать произвольный алгоритм леса для прогнозирования последней переменной y (...
вопрос задан: 14 July 2018 01:29
0
ответов

Как использовать случайные леса в R с пропущенными значениями?

библиотека (randomForest) rf.model <- randomForest (WIN ~., data = learn) Я хотел бы использовать случайную модель леса, но получаю эту ошибку: Ошибка в na.fail.default (list (WIN = c (2L, 1L, 1L , 2L, 1L, 2L, ...
вопрос задан: 8 July 2019 14:47
0
ответов

Как получить одинаковые результаты в разных итерациях в RandomForest в sklearn

Я использую классификатор Random Forest для классификации и на каждой итерации я получаю разные результаты. Мой код выглядит следующим образом. input_file = 'sample.csv' df1 = pd.read_csv (input_file) df2 = pd ....
вопрос задан: 28 March 2019 04:23
0
ответов

Как увидеть случайное подмножество данных, созданное Matlab TreeBagger

Я использую MATLAB TreeBagger для создания случайного леса. Я использую следующий код для создания леса и деревьев представления
вопрос задан: 5 March 2019 03:44
0
ответов

Как бороться с «Термин ошибки и без аргумента данных» в RandomForest?

sample = sample.split (brecancer, SplitRatio = 0.7) train = подмножество (Нагрудник, образец == TRUE) тест = подмножество (Нагрудник, образец == FALSE) train = нагрудный рак [1: 400] test = ...
вопрос задан: 19 January 2019 18:40
0
ответов

Непрерывно не поддерживается ошибка в RandomForestRegressor

Я просто пытаюсь сделать простой пример RandomForestRegressor. Но при проверке точности я получаю эту ошибку /Users/noppanit/anaconda/lib/python2.7/site-packages/sklearn/metrics/classification.pyc ...
вопрос задан: 19 January 2019 17:07
0
ответов

Rpy2 (работа с Dataframes) - Как решить конфликты Python (NaN) и R (NA)?

У меня есть pandas dataFrame: результат с 2 столбцами. doy (day_of_year: независимая переменная, значения 1,2,3, .... 365). бронирования (зависимая переменная, 279 числовых значений и 86 значений NaN) Пожалуйста, найдите ...
вопрос задан: 18 January 2019 09:26
0
ответов

Как понять randomForest :: rfImpute?

Я пытаюсь понять, как модуль rfImpute from randomForest работает в R. Стандартный пример документации, использующей набор данных iris, приведен ниже: data (iris) iris.na < - iris ...
вопрос задан: 16 January 2019 12:36
0
ответов

Подходящая модель дает NULL

Я хочу тренировать модели, используя разные алгоритмы. Например, эта работа: dd = read.arff ("china.arff") model = lm (Effort ~. Data = dd) подогнана (модель) Но следующий код дает NULL для того же самого ...
вопрос задан: 3 January 2019 14:31
0
ответов

Какова важность выборки подпространства в случайном лесу?

Что произойдет, если мы не будем использовать выборку подпространства (выбор случайных функций) в алгоритме случайного леса? Будет ли наша модель работать так же, как единое дерево решений? Как производится выборка подпространства ...
вопрос задан: 14 July 2018 00:43
0
ответов

Пакеты / модели R, которые могут обрабатывать NA

Я ищу пакеты R или модели / алгоритмы машинного обучения, такие как randomForest, glmnet, gbdt и т. Д., Которые могут обрабатывать NA, в отличие от игнорирования строки или столбца с любые случаи НС. Я не ...
вопрос задан: 17 October 2017 22:20
0
ответов

OpenCV - Пример случайного леса

Есть ли у кого-нибудь пример использования случайных лесов с 2.3.1 API Mat, а не cvMat? В основном у меня есть данные Matrix Mat, состоящие из 1000 строк с элементами 16x16x3 и Matrix Mat ...
вопрос задан: 22 April 2017 01:19
0
ответов

RandomForest в R линейной регрессии хвосты mtry

Я использую RandomForest пакет в R (R версии 2.13.1, RandomForest версия 4.6-2) для регрессии и заметили значительное смещение в моих результатах: ошибка прогнозирования зависит на стоимости ...
вопрос задан: 13 April 2017 12:44
0
ответов

Как улучшить производительность randomForest?

У меня есть тренировочный набор размером 38 МБ (12 атрибутов с 420000 строками). Я использую приведенный ниже фрагмент кода R для обучения модели с использованием randomForest. Это занимает несколько часов для меня. rf.model <- randomForest (...
вопрос задан: 15 February 2017 09:34
0
ответов

R есть ли способ найти значения Inf / -Inf?

Я пытаюсь запустить randomForest на большом наборе данных (5000x300). К сожалению, я получаю следующее сообщение об ошибке:> RF <- randomForest (prePrior1, postPrior1 [, 6] +, ...
вопрос задан: 27 November 2016 05:53
0
ответов

Изучение дерева решений и примеси

Есть три способа измерения примесей: каковы различия и подходящие варианты использования для каждого метода?
вопрос задан: 8 November 2016 17:19
0
ответов

Что означает параметр 'classwt' в функции RandomForest в пакете RandomForest в R означает?

На странице справки для randomforest::randomforest()говорится:«classwt -Приоритеты классов. В сумме не должно быть единицы. Игнорируется для регрессии». Может ли настройка параметра classwt помочь, когда у вас тяжелое...
вопрос задан: 28 September 2016 17:45
0
ответов

Действительно ли метод rfcv R randomForest говорит, какие функции он выбрал, или нет?

Я хотел бы использовать rfcv для отбраковки неважных переменных из набора данных перед созданием окончательного случайного леса с большим количеством деревьев (, пожалуйста, исправьте и сообщите мне, если это не тот способ использования этого...
вопрос задан: 20 July 2015 21:09
0
ответов

Что означает отрицательный% IncMSE в пакете RandomForest?

Я использовал RandomForest для проблемы регрессии. Я использовал важность (rf, type = 1), чтобы получить% IncMSE для переменных, и одна из них имеет отрицательный% IncMSE. Значит ли это, что эта переменная вредна для ...
вопрос задан: 18 July 2015 03:35
0
ответов

R: Печать модели случайного леса в HTML

Я работаю над документом Rmd, который я хотел бы скомпилировать в html, используя пакет knitr через механизм экспорта HTML, доступный в RStudio. Проблема может быть воспроизведена с кодом ниже: Пример # ...
вопрос задан: 19 February 2015 16:50
0
ответов

Случайные леса в R (пустые классы в y и длина аргумента 0)

Я впервые имею дело со случайными лесами, и у меня возникают некоторые проблемы, которые я не могу понять ... Когда я запускаю анализ всего моего набора данных (около 3000 строк), я не получаю никакого сообщения об ошибке. Но ...
вопрос задан: 22 November 2012 01:10