Я хотел бы запланировать и распределить на нескольких машинах - Windows или Ubuntu - (одна задача только на одной машине) выполнение сценариев R (например, с использованием RServe).
Я не хочу изобретать велосипед и хотел бы использовать уже существующую систему для оптимального распределения этих задач и, в идеале, иметь графический интерфейс для управления правильным выполнением скриптов.
1 / Можно ли для этого использовать пакет R или библиотеку?
2 / Одна из библиотек, которая, по-видимому, довольно широко используется, - это mapReduce с Apache Hadoop. У меня нет опыта работы с этим фреймворком. Какую установку / плагин / настройку вы бы посоветовали для моей цели?
Изменить: Вот более подробная информация о моей настройке:
У меня действительно есть офис, полный машин (небольших серверов или рабочих станций), которые иногда также используются для других цель.Я хочу использовать вычислительную мощность всех этих машин и распространять на них свои R-скрипты.
Мне также нужен планировщик, например. инструмент для планирования сценариев в определенное время или регулярно.
Я использую как Windows, так и Ubuntu, но пока достаточно хорошего решения для одной из систем.
Наконец, мне не нужен сервер, чтобы вернуть результат скриптов. Скрипты выполняют такие действия, как доступ к базе данных, сохранение файлов и т. Д., Но ничего не возвращают. Я просто хотел бы вернуть сообщения об ошибках / предупреждениях, если они есть.