Я ищу эффективный (как с точки зрения компьютерных ресурсов, так и с точки зрения обучения/реализации) метод объединения двух больших (размер> 1 млн./300 КБ файла RData) данных. кадры.
«слияние» в базе R и «объединение» в plyr, по-видимому, израсходовали всю мою память, что привело к сбою моей системы.
Пример
загрузите тестовый фрейм данных
и попробуйте
test.merged<-merge(test, test)
или
test.merged<-join(test, test, type="all")
В следующем посте представлен список слияния и альтернатив:
Как соединить (объединить) фреймы данных (внутренний, внешний, левый, правый)?
Следующее позволяет проверять размер объекта:
https://heuristically.wordpress.com/2010/01/04/r-memory-usage-statistics-variable/
Данные, созданные анонимным