Это скорее вопрос новичка. Скажем, у меня есть следующий код:
library("multicore")
library("iterators")
library("foreach")
library("doMC")
registerDoMC(16)
foreach(i in 1:M) %dopar% {
##do stuff
}
Затем этот код будет работать на 16 ядрах, если они доступны. Теперь, если я правильно понимаю, использую Amazon EC2 на одном экземпляре, я получаю в зависимости от экземпляра только несколько ядер. Поэтому, если я хочу запустить моделирование на 16 ядрах, мне нужно использовать несколько экземпляров, что означает, насколько я понимаю, запуск новых процессов R. Но тогда мне нужно написать дополнительный код вне R, чтобы собрать результаты.
Итак, мой вопрос: существует ли пакет R, который позволяет запускать экземпляры EC2 изнутри R, автоматически распределяет нагрузку между этими экземплярами и собирает результаты в начальном запущенном R?