объединить строку с помощью команды hdfs

Вы можете написать какой-нибудь очень сжатый код, чтобы сделать это, используя pandas :

In [24]: import numpy as np

In [25]: from pandas import Series

In [27]: sample = np.random.choice(['a', 'b'], size=10)

In [28]: s = Series(sample)

In [29]: s
Out[29]:
0    a
1    b
2    b
3    b
4    a
5    b
6    b
7    b
8    b
9    a
dtype: object

In [30]: vc = s.value_counts()

In [31]: vc
Out[31]:
b    7
a    3
dtype: int64

In [32]: vc = vc.sort_index()

In [33]: vc
Out[33]:
a    3
b    7
dtype: int64

In [34]: vc.plot(kind='bar')

Результат:

enter image description here [/g1]

0
задан CarCrazyBen 16 January 2019 в 23:58
поделиться

1 ответ

Вы можете просматривать результаты в одной строке и делать разные вещи. В вашем случае:

for i in `hdfs dfs -ls /archive/reporting/some_dir | awk '{print $6,$7,$8}' | grep 2019-01-1`; do
   echo "hdfs dfs -cp $i"
done
0
ответ дан axiom 16 January 2019 в 23:58
поделиться
Другие вопросы по тегам:

Похожие вопросы: