Я использую Pandas для манипулирования файлом csv с несколькими строками и столбцами, который выглядит следующим образом
Fullname Amount Date Zip State .....
John Joe 1 1/10/1900 55555 Confusion
Betty White 5 . . Alaska
Bruce Wayne 10 . . Frustration
John Joe 20 . . .
Betty White 25 . . .
Я хотел бы создать новый столбец под названием «Всего» с общей суммой сумма на каждого человека. (Идентифицируется по полному имени и почтовому индексу). Мне трудно найти правильное решение.
Давайте просто назовем мой csv import csvfile. Вот что у меня есть.
import Pandas
df = pandas.read_csv('csvfile.csv', header = 0)
df.sort(['fullname'])
Я думаю, что должен использовать итерроу, чтобы сделать то, что я хочу, как объект. Проблема с удалением дубликатов состоит в том, что я потеряю сумму, или сумма может отличаться.