Как я могу использовать пакет R randomForest
с весами наблюдений?Я знаю, что в этом пакете нет такой опции.У меня 2 вопроса:
Есть ли решения этой проблемы с использованием пакета randomForest
? В данный момент я рисую выборки из данных с весами в качестве вероятности, поэтому я могу, по крайней мере, смоделировать это:
m = dim(data)[1]
выборка (данные, м, замена = ИСТИНА, вероятность = веса)
Работает, есть ли другие (лучшие) решения?
Существуют ли альтернативы пакету randomForest
. Я нашел пакет party
(cforest), но он ужасен с точки зрения управления памятью (или я не могу использовать его так, как использую пакет randomForest
). У меня около 200 тысяч наблюдений и 30-40 переменных.
РЕДАКТИРОВАТЬ:
Извините, что не уточнил подробности. Я использую пакет randomForest
для решения задачи регрессии (не классификации). Это временной ряд, и каждое наблюдение имеет свой вес. Позже этот вес используется для определения производительности модели по тестовым наблюдениям. Переменная y непрерывна.