Как перенести данные из кластера Cassandra размера N в другой кластер размера N +/- M

Я пытаюсь понять, как перенести данные из одного кластера cassandra в другой кластер cassandra с другим размером кольца ... скажем, из кластера с 5 узлами в кластер с 7 узлами.

Я начал изучать sstable2json, поскольку он создает файл json для SSTable на этом конкретном узле cassandra. Я думал сделать это для семейства столбцов на каждом узле кольца. Таким образом, в кольце из 5 узлов это даст мне 5 файлов json, один файл для данных, хранящихся в семействе столбцов, которое находится на каждом узле.

Затем я объединю файлы json в один файл и использую json2sstable для импорта в новый кластер, размером, скажем, 7. Я надеялся, что тогда cassandra будет реплицировать / балансировать данные равномерно по узлам в кольцо, но я только что прочитал, что SSTables неизменны после написания. Так что, если бы я сделал то, что только что упомянул, у меня бы получилось кольцо со всеми данными в моем семействе столбцов на одном узле.

Так может ли кто-нибудь помочь мне разобраться в процессе миграции данных из одного кластера в другой? кластер с другим размером кольца?

7
задан Brian Tompsett - 汤莱恩 20 January 2016 в 14:54
поделиться