RandomForest в R линейной регрессии хвосты mtry

Я использую RandomForest пакет в R (R версию 2.13.1, RandomForest версии 4.6-2) для регрессии и заметил значительное смещение в моих результатах: ошибка прогнозирования зависит от значения переменной отклика. Высокие значения в соответствии с прогнозируемым и низкие значения над предсказаны. Сначала я подозревал, что это было следствие моих данных, но следующий простой пример показывает, что это присуще алгоритм случайного леса:

n = 50; 
x1 = seq(1,n) 
x2 = matrix(1, n, 1)
predictors = data.frame(x1=x1, x2=x2)
response = x2 + x1
rf = randomForest(x=predictors, y=response)
plot(x1, response)
lines(x1, predict(rf, predictors), col="red")

Нет методы сомнения дерева имеют свои ограничения, когда речь идет о линейности, но даже самое простое дерево регрессии, например, дерево () в R, не проявляет этот уклон. Я не могу себе представить, что сообщество не знать об этом, но не нашел ни одного упоминания, как это обычно скорректированное для? Спасибо за любые комментарии

EDIT: Пример для этого вопроса ошибочен, смотрите «RandomForest для регрессии в R - распределения отклика зависимого смещения» при обмене стеки для улучшенной обработки https://stats.stackexchange.com / вопросы / 28732 / RandomForest-для-регрессии-в-р-ответ-распределение в зависимости от смещения

6
задан Community 13 April 2017 в 12:44
поделиться