Вы можете написать какой-нибудь очень сжатый код, чтобы сделать это, используя pandas :
In [24]: import numpy as np
In [25]: from pandas import Series
In [27]: sample = np.random.choice(['a', 'b'], size=10)
In [28]: s = Series(sample)
In [29]: s
Out[29]:
0 a
1 b
2 b
3 b
4 a
5 b
6 b
7 b
8 b
9 a
dtype: object
In [30]: vc = s.value_counts()
In [31]: vc
Out[31]:
b 7
a 3
dtype: int64
In [32]: vc = vc.sort_index()
In [33]: vc
Out[33]:
a 3
b 7
dtype: int64
In [34]: vc.plot(kind='bar')
Результат:
[/g1]
Вы можете просматривать результаты в одной строке и делать разные вещи. В вашем случае:
for i in `hdfs dfs -ls /archive/reporting/some_dir | awk '{print $6,$7,$8}' | grep 2019-01-1`; do
echo "hdfs dfs -cp $i"
done