Найти, где столбец соответствует более одного в другом столбце

Вам не нужно выставлять файл сценария, так как вам нужно сделать это только тогда, когда вы хотите включить скрипт из другого. Все, что вам нужно сделать, это запустить его:

Process("bash trial.sh").lineStream
1
задан nick 20 January 2019 в 12:10
поделиться

1 ответ

Если вы просто хотите, чтобы строки нарушали это условие, используйте groupby и проверьте с помощью nunique:

df[df.groupby('COL1').COL2.transform('nunique') > 1]

Или с groupby, nunique и map:

df[df.COL1.map(df.groupby('COL1').COL2.nunique()) > 1]

  COL1  COL2
1    B     2
2    B     2
3    B     3

Если вы хотите отобразить значение COL1 на значения COL2, вы можете использовать дополнительные groupby и apply:

df[df.groupby('COL1').COL2.transform('nunique') > 1].groupby('COL1').COL2.apply(set)

COL1
B    {2, 3}
Name: COL2, dtype: object

И, наконец, если все, что вам нужно, это «количество элементов» для> 1 значений COL1, используйте

df.groupby('COL1').COL2.nunique().to_frame().query('COL2 > 1')

      COL2
COL1      
B        2
0
ответ дан coldspeed 20 January 2019 в 12:10
поделиться
Другие вопросы по тегам:

Похожие вопросы: