Рекомендуйте альтернативу [закрытой] Microsoft HPC

6
задан Pavel Radzivilovsky 30 June 2010 в 12:15
поделиться

7 ответов

Я бы взглянул на проект высокопроизводительных вычислений Condor . Он поддерживает клиенты и серверы Windows (и Linux, и OSX), обрабатывает сложные зависимости между задачами с помощью DAGman и может приостанавливать (и даже перемещать) задачи. У меня есть опыт работы с системами на базе Condor, которые масштабируются до тысяч машин в университетских городках.

6
ответ дан 16 December 2019 в 21:34
поделиться

Вы смотрели Беовульф ? Множество дистрибутивов на выбор и множество вариантов настройки. Вы должны быть в состоянии найти что-то, что удовлетворит ваши потребности ...

0
ответ дан 16 December 2019 в 21:34
поделиться

Platform LSF сделает все, что вам нужно. Он работает под управлением Windows. Она является коммерческой, и ее можно приобрести с поддержкой.

Да. 1. Имеется выделенный управляющий компьютерный узел и до 100 вычислительных узлов. Кластер должен быть легко расширяемым.

Да 2. Он построен на основе концепции "работа-задача". Одно задание может иметь от одной до 100 000 задач.

Да 3. Задание, инициированное пользователем на узле менеджера, приводит к созданию заданий на вычислительном узле.

Да 4. Задания создают другие задания на лету.

Да 5. Некоторые задачи могут выполняться в течение нескольких минут, в то время как другие могут занять много часов.

Да 6. Задачи выполняются в соответствии с иерархией зависимостей, которая может обновляться на лету.

Да 7. Работа может быть приостановлена и возобновлена позже.

Да 8. Каждое задание требует определенных ресурсов в виде процессора (ядер), памяти и места на локальном жестком диске. Менеджер должен знать об этом при планировании заданий.

Да 9. Задачи сообщают менеджеру о своем прогрессе и результатах.

Да 10. Менеджер знает, жива ли задача или зависла.

3
ответ дан 16 December 2019 в 21:34
поделиться

Я бы порекомендовал Беовульфа, потому что Беовульф ведет себя больше как одна машина, чем как множество рабочих станций.

0
ответ дан 16 December 2019 в 21:34
поделиться

попробуйте увеличить сетку . Это должно упростить добавление узлов во время выполнения, и вы можете контролировать / управлять кластером с помощью интерфейсов jmx

0
ответ дан 16 December 2019 в 21:34
поделиться

Если вы не против разместить свой проект в облаке, вы можете взглянуть на Windows Azure / Appfabric . AFAIK это позволяет вам распределять ваши задания через рабочие процессы, и вы можете динамически добавлять больше рабочих машин для обработки ваших заданий по мере увеличения нагрузки.

0
ответ дан 16 December 2019 в 21:34
поделиться

Вы исследовали SunGrid Engine ? Прошло много времени с тех пор, как я использовал его, и я никогда не использовал его в полной мере, но это мое понимание.

  1. Имеется выделенный управляющий компьютерный узел и до 100 вычислительных узлов. Кластер должен легко расширяться. да
  2. Он построен на концепции «работа-задача». Задание может содержать от 1 до 100 000 задач. не уверен
  3. Задание, инициированное пользователем на узле-диспетчере, приводит к созданию задач на вычислительном узле. да
  4. Задачи создают другие задачи на лету. Думаю, да?
  5. Некоторые задачи могут выполняться в течение нескольких минут, а другие могут занять много часов. да
  6. Задачи выполняются в соответствии с иерархией зависимостей, которая может обновляться на лету. not sure
  7. Задание может быть приостановлено и возобновлено позже. не уверен
  8. Для каждой задачи требуются определенные ресурсы в виде ЦП (ядер), памяти и места на локальном жестком диске. Менеджеру следует помнить об этом при планировании задач. почти уверен
  9. Задачи сообщают о своем прогрессе и результатах обратно менеджеру. почти уверен

` 10. Менеджер знает, жива задача или зависла. да

-1
ответ дан 16 December 2019 в 21:34
поделиться
Другие вопросы по тегам:

Похожие вопросы: