Привет, ребята, я надеюсь, что тема достаточно ясна, я не нашел ничего конкретно по этому поводу в ранее заданной корзине. Я пробовал реализовать это на Perl или Python, но думаю, что, возможно, слишком стараюсь.
Есть ли простая команда / конвейер оболочки, которая разделит мой файл .txt размером 4 МБ на отдельные файлы .txt на основе начала и заканчивая регулярным выражением?
Я привожу небольшой образец файла ниже ... чтобы вы могли видеть, что каждая «история» начинается с фразы «X из XXX ДОКУМЕНТОВ», которую можно использовать для разделения файла.
Я думаю, это должно быть легко, и я удивлюсь, если bash не сможет этого сделать - быстрее, чем Perl / Py.
Вот он:
1 of 999 DOCUMENTS
Copyright 2011 Virginian-Pilot Companies LLC
All Rights Reserved
The Virginian-Pilot(Norfolk, VA.)
...
3 of 999 DOCUMENTS
Copyright 2011 Canwest News Service
All Rights Reserved
Canwest News Service
...
Заранее спасибо за вашу помощь.
Росс
]