Случайный лес в большом наборе данных

У меня есть большой набор данных в R (1M+ строк по 6 столбцов), который я хочу использовать для обучения случайного леса (используя randomForestpackage) для целей регрессии. К сожалению, я получаю Ошибка в матрице (0, n, n): слишком много элементов указано ошибка при попытке сделать все сразу и не может выделить достаточно памяти виды ошибок при работе с подмножеством данных - до 10 000 или около того наблюдений.

Видя, что у меня нет возможности добавить больше ОЗУ на мою машину, а случайные леса очень подходят для типа процесса, который я пытаюсь смоделировать, я бы очень хотел, чтобы это работало.

Приветствуются любые предложения или идеи обходного пути.

6
задан ktdrv 5 April 2012 в 23:05
поделиться