Мы пытаемся поэкспериментировать с использованием пакета gbm на довольно большом наборе данных (~140 миллионов строк )и столкнулись с проблемой требований к памяти R.
Мы безуспешно пытались объединить пакеты «gbm» и «bigmemory», и нашей следующей мыслью было изменить исходный код C++ для получения данных из локальной базы данных, в которой мы сохранили наш набор данных.
Итак, нам было интересно, существует ли более подходящая или хорошо -известная практика для изменения распределения внутри кода gbm на C++. Кто-нибудь пробовал что-то подобное?