Как я могу быть уверен, что данные распределяются равномерно по узлы hadoop?

Если я копирую данные из локальной системы в HDFS, могу ли я быть уверен, что они равномерно распределяются по узлам?

PS HDFS гарантирует, что каждый блок будет храниться на 3 разных узлах . Но означает ли это, что все блоки моих файлов будут отсортированы на одних и тех же 3 узлах? Или HDFS будет выбирать их случайным образом для каждого нового блока?

6
задан Cœur 8 December 2018 в 19:17
поделиться