Я использую plyr, верно? Кажется, я использую слишком много памяти

У меня есть следующий, довольно большой набор данных:

 > dim(dset)
 [1] 422105     25
 > class(dset)
 [1] "data.frame"
 > 

Без каких-либо действий процесс R, похоже, занимает около 1 ГБ ОЗУ.

Я пытаюсь запустить следующий код:

  dset <- ddply(dset, .(tic), transform,
                date.min <- min(date),
                date.max <- max(date),
                daterange <- max(date) - min(date),
                .parallel = TRUE)

Запуск этого кода приводит к резкому увеличению использования оперативной памяти. Он полностью заполнил 60 ГБ оперативной памяти, работающей на 32-ядерном компьютере. Что я делаю не так?

9
задан Matt Dowle 13 December 2011 в 14:17
поделиться