Управление распределенным кластером?

Предположим, что на одной из них настроен кластер cassandra. У вас есть база данных размером 10 [ТБ], которая равномерно распределена между 10 узлами, все работает без сбоев и т. Д.

Предположим, в вашем распоряжении 100 машин, каждый пытается прочитать (разные) данные из кластера кассандры. кроме того, у вас есть много заданий, которые необходимо выполнять постоянно, каждое задание в разное время (и, очевидно, каждое задание должно выполняться на другом компьютере).

Как вы управляете всеми этими задачами / заданиями? как распределять задачи между машинами? как вы отслеживаете задания / машины в процессе?

Существуют ли какие-либо инструменты с открытым исходным кодом (желательно с клиентом Python ), которые помогают делать это в среде Linux?

5
задан user3262424 15 April 2011 в 00:18
поделиться