Как получить индекс для всех дубликатов в кадре данных (pandas - python)

3
задан Jordan Singer 16 January 2019 в 22:05
поделиться

3 ответа

Ваша последняя попытка близка. Вместо группировки по всем столбцам, просто используйте список тех, которые вы хотите рассмотреть:

0
ответ дан jpp 16 January 2019 в 22:05
поделиться

Различные макеты groupby

df.index.to_series().groupby([df['A'],df['B']]).apply(list)
Out[449]: 
A  B
1  3    [0, 1, 2]
2  4       [3, 4]
   5          [5]
dtype: object
0
ответ дан Wen-Ben 16 January 2019 в 22:05
поделиться

У вас может быть .groupby, чтобы вернуть dict с ключами, которые являются метками группы (кортежи для нескольких столбцов), а значениями являются индексом

df.groupby(['A', 'B']).groups

#{(1, 3): Int64Index([0, 1, 2], dtype='int64'),
# (2, 4): Int64Index([3, 4], dtype='int64'),
# (2, 5): Int64Index([5], dtype='int64')}
0
ответ дан ALollz 16 January 2019 в 22:05
поделиться
Другие вопросы по тегам:

Похожие вопросы: