У меня есть большой набор данных в R (1M+ строк по 6 столбцов), который я хочу использовать для обучения случайного леса (используя randomForest
package) для целей регрессии. К сожалению, я получаю Ошибка в матрице (0, n, n): слишком много элементов указано
ошибка при попытке сделать все сразу и не может выделить достаточно памяти виды ошибок при работе с подмножеством данных - до 10 000 или около того наблюдений.
Видя, что у меня нет возможности добавить больше ОЗУ на мою машину, а случайные леса очень подходят для типа процесса, который я пытаюсь смоделировать, я бы очень хотел, чтобы это работало.
Приветствуются любые предложения или идеи обходного пути.