Продукт моей компании будет производить петабайты данных каждый год на сайтах наших клиентов. Я хочу заполнить многопетабайтный NAS, чтобы смоделировать систему, которая работает в течение длительного времени (3 месяца, 6 месяцев, год и т. Д.). Мы хотим анализировать наше программное обеспечение, пока оно работает в системе хранения под нагрузкой. .
Я мог бы написать сценарий, который создает эти данные (для выполнения одного сценария могут потребоваться недели или месяцы). Есть ли рекомендации, как отдать сценарий (несколько машин, несколько потоков)? На NAS имеется 3 балансировки нагрузки входящие ссылки ... должен ли я запускаться непосредственно на устройстве NAS?
Существуют ли сторонние продукты, которые я мог бы использовать для создания нагрузки? Я даже не знаю, как начать поиск таких продуктов.
Есть ли имеет значение, реалистичны ли данные? Кто-нибудь знает что-нибудь об архитектуре NAS / хранилища? Могут ли это быть случайные биты или обычные важны ли данные? Мы распределяем данные на диск в этом формате
x:\<year>\<day-of-year>\<hour>\<minute>\<guid-file-name>.ext