Я работаю с Hadoop, и мне нужно найти, какие из ~100 файлов в моей файловой системе Hadoop содержат определенную строку.
Я вижу файлы, которые хочу найти, вот так:
bash-3.00$ hadoop fs -ls /apps/mdhi-technology/b_dps/real-time
..который возвращает несколько таких записей:
-rw-r--r-- 3 b_dps mdhi-technology 1073741824 2012-07-18 22:50 /apps/mdhi-technology/b_dps/HADOOP_consolidated_RT_v1x0_20120716_aa
-rw-r--r-- 3 b_dps mdhi-technology 1073741824 2012-07-18 22:50 /apps/mdhi-technology/b_dps/HADOOP_consolidated_RT_v1x0_20120716_ab
Как узнать, какой из них содержит строку bcd4bc3e1380a56108f486a4fffbc8dc
? Как только я узнаю, я могу редактировать их вручную.