Я собираю логи с помощью Flume в HDFS. Для тестового примера у меня есть небольшие файлы (~ 300 КБ), потому что процесс сбора журналов был масштабирован для реального использования.
Есть ли какой-нибудь простой способ объединить эти небольшие файлы в более крупные, которые ближе к размеру блока HDFS (64 МБ )?