У меня есть файл Apache access.log размером около 35 ГБ. Пробираться через него больше не вариант, не дожидаясь многого.
Я хотел разделить его на множество небольших файлов, используя дату в качестве критерия разделения.
Дата в формате [15/Oct/2011:12:02:02 +0000]
. Любая идея, как я могу сделать это, используя только скрипты bash, стандартные программы для работы с текстом (grep, awk, sed и тому подобное ), конвейер и перенаправление?
Имя входного файла access.log
. Я бы хотел, чтобы выходные файлы имели формат, напримерaccess.apache.15_Oct_2011.log
(это помогло бы, хотя и не очень хорошо при сортировке.)