Эффективные альтернативы слиянию для больших data.frames R

Я ищу эффективный (как с точки зрения компьютерных ресурсов, так и с точки зрения обучения/реализации) метод объединения двух больших (размер> 1 млн./300 КБ файла RData) данных. кадры.

«слияние» в базе R и «объединение» в plyr, по-видимому, израсходовали всю мою память, что привело к сбою моей системы.

Пример
загрузите тестовый фрейм данных

и попробуйте

test.merged<-merge(test, test)

или

test.merged<-join(test, test, type="all")  
    -

В следующем посте представлен список слияния и альтернатив:
Как соединить (объединить) фреймы данных (внутренний, внешний, левый, правый)?

Следующее позволяет проверять размер объекта:
https://heuristically.wordpress.com/2010/01/04/r-memory-usage-statistics-variable/

Данные, созданные анонимным

27
задан Community 23 May 2017 в 11:33
поделиться