Просто хочу добавить ответ Бена на drop_duplicates :
keep
: {'first', 'last', False}, по умолчанию 'first'
Итак, установите keep
в False, мы дадим вам желаемый ответ.
DataFrame.drop_duplicates (* args, ** kwargs) Возвращает DataFrame с дублирующимися строками, только с учетом определенных столбцов
Параметры: подмножество: метка столбца или последовательность меток, необязательно Учитывать только определенные столбцы для идентификации дубликатов, по умолчанию использовать все столбцы: {'first', 'last', False }, по умолчанию сначала «первым»: сбросить дубликаты, за исключением первого вхождения. last: удалить дубликаты, за исключением последнего вхождения. False: удалить все дубликаты. take_last: устаревший inplace: boolean, по умолчанию False Отбрасывать дубликаты на месте или возвращать копии cols: только аргумент kwargs подмножества [устаревший] Возвраты: дедуплицированный: DataFrame
blockquote>