распределенная система планирования для сценариев R

Я хотел бы запланировать и распределить на нескольких машинах - Windows или Ubuntu - (одна задача только на одной машине) выполнение сценариев R (например, с использованием RServe).

Я не хочу изобретать велосипед и хотел бы использовать уже существующую систему для оптимального распределения этих задач и, в идеале, иметь графический интерфейс для управления правильным выполнением скриптов.

1 / Можно ли для этого использовать пакет R или библиотеку?

2 / Одна из библиотек, которая, по-видимому, довольно широко используется, - это mapReduce с Apache Hadoop. У меня нет опыта работы с этим фреймворком. Какую установку / плагин / настройку вы бы посоветовали для моей цели?

Изменить: Вот более подробная информация о моей настройке:
У меня действительно есть офис, полный машин (небольших серверов или рабочих станций), которые иногда также используются для других цель.Я хочу использовать вычислительную мощность всех этих машин и распространять на них свои R-скрипты.
Мне также нужен планировщик, например. инструмент для планирования сценариев в определенное время или регулярно. Я использую как Windows, так и Ubuntu, но пока достаточно хорошего решения для одной из систем. Наконец, мне не нужен сервер, чтобы вернуть результат скриптов. Скрипты выполняют такие действия, как доступ к базе данных, сохранение файлов и т. Д., Но ничего не возвращают. Я просто хотел бы вернуть сообщения об ошибках / предупреждениях, если они есть.

5
задан RockScience 30 December 2011 в 03:04
поделиться