Помню, я где-то читал, что производительность Hadoop значительно ухудшается, если машины, на которых он работает, сильно отличаются друг от друга, но я больше не могу найти этот комментарий. Я рассматриваю возможность запуска кластера Hadoop в массиве виртуальных машин, который не управляется напрямую моей группой, и мне нужно знать, является ли это требованием, которое я должен указать в своем запросе.
Итак, должен ли я настаивать на том, чтобы на всех моих машинах было одинаковое оборудование, или можно работать на разных машинах с разными аппаратными конфигурациями?
Спасибо.