В приведенной ниже программе, в чем разница между созданным мной 2 объектами, и в чем преимущество 2-го

Если вы хотите, чтобы результат сохранялся в другом наборе данных:

df.drop_duplicates(keep=False)

или

df.drop_duplicates(keep=False, inplace=False)

Если один и тот же набор данных необходимо обновить:

df.drop_duplicates(keep=False, inplace=True)

Вышеприведенные примеры удаляют все дубликаты и сохраняют один, похожий на DISTINCT * в SQL

0
задан SomeJavaGuy 26 February 2015 в 11:19
поделиться