10
ответов

Как я могу суммировать только первый элемент каждой группы в первом столбце GroupBy при наличии нескольких столбцов GroupBy? [Дубликат]

Я относительно новичок в пандах, и мне трудно создать новый столбец на основе суммированной группы. Вот фрагмент моего набора данных: В [1478]: mkt_vals_joined [['GameId', 'Year', 'HomeTeam', '...
вопрос задан: 25 January 2017 19:26
9
ответов

как выполнить итерацию через несколько PDF и удалить те столбцы, которые содержат только NA [duplicate]

У меня есть несколько фреймов данных, и я просто хотел отфильтровать столбец, который имеет хотя бы значение и хотел бы удалить столбцы, содержащие только значения NA. Я пробовал с кодом ниже, но я ...
вопрос задан: 5 January 2017 18:01
8
ответов

Разделить список на строки в Pandas [duplicate]

Я делаю «Что готовит?» Kaggle вызов, и у меня есть dataframe, который имеет три столбца (обратите внимание, что последний содержит список): кухня id ингредиенты 0 греческий 10259 [romaine ...
вопрос задан: 9 September 2015 00:22
7
ответов

Pandas Max Row возвращает для подмножества значений в столбце [duplicate]

У меня есть Dataframe цен на акции, основанный на индексе datetime (3 года) для примерно 20 компаний и символов. Данные выглядят следующим образом: & lt; bound method NDFrame.head даты закрытия тикера ...
вопрос задан: 26 March 2017 01:00
7
ответов

Объедините две последовательные строки в один, имеющий один и тот же уникальный ключ в python [duplicate]

У меня есть dataframe с 1K строк, я хочу объединить строки, имеющие одинаковое имя, ID, Контекст в одном, например. Фактический идентификатор Dataframe Название Conc Val1 Val2 1 XYZ 10 0 1 XYZ 0 20 2 ABC ...
вопрос задан: 7 October 2016 22:06
7
ответов

Как суммировать сгруппированные значения по столбцу на python [duplicate]

Я сгруппировал некоторые данные по одному столбцу: mcnfecha mcnvalcred 872 2015-12-31 3310750.00 871 2015-12-31 3290000.00 870 2015-12-31 3274402.00 869 2015-12-31 3253600.00 ...
вопрос задан: 7 October 2016 22:06
4
ответа

Как сгруппировать кадр данных, чтобы получить счеты двумя ключами в Python с помощью groupby () в функции [duplicate]

У меня есть набор данных, который выглядит так: yg = pd.DataFrame ({'grade': ['a', 'a', 'b', 'b', 'a'], 'key2': ['one ',' 2 ',' one ',' two ',' one '],' year ': (2012,2013,2012,2012, ...
вопрос задан: 3 May 2016 11:38
4
ответа

Моя группа не сообщает мне, когда атрибут в функции НЕ существует. [Дубликат]

По сути, я использую группу в пандах, которая обеспечивает подсчет для определенных групп данных - отлично работает! Тем не менее, мой код не даст мне счет «0» за четверть игры, когда ...
вопрос задан: 3 May 2016 11:38
4
ответа

Как сохранить фрейм данных из вывода из группы с помощью [duplicate]

Как сохранить фрейм данных из вывода из группы pandas как что-то вроде вывода 2, приведенного ниже, без отображения обеих категорий в первом столбце (я думаю, что это индекс). Код ниже ...
вопрос задан: 7 November 2015 11:19
4
ответа

используя pandas для объединения строк на основе значения в столбце [duplicate]

У меня есть dataframe, который выглядит так: Index cpc subclass group 0 F21S9 / 02 F21S 9/02 1 F21S9 / 024 F21S 9/024 2 F21V15 / 013 ...
вопрос задан: 6 March 2014 10:31
4
ответа

Как группировать и суммировать значения в pandas DataFrame? [Дубликат]

У меня есть следующий DataFrame: UserId ItemId Количество 0 5 80233246 2 1 7 50313046 2 2 8 30298023 2 3 8 70279942 2 4 9 30339349 6 5 10 90388087 2 6 11 ...
вопрос задан: 6 March 2014 10:31
4
ответа

Несколько операций группировки столбцов данных (дубликаты)

import pandas as pd import numpy как np df = pd.DataFrame (np.random.randint (0,10, size = (10, 3)), columns = ['price', 'created_year', 'price_per_cm'], index = диапазон (1,11)) ...
вопрос задан: 25 January 2013 22:26
3
ответа

панды групповой - пользовательская функция

У меня есть следующий фрейм данных, для которого я использую groupby и sum (): d = {'col1': ["A", "A", "A", "B", "B", "B", "C" , "C", "C"], 'col2': [1,2,3,4,5,6, np.nan, np.nan, np.nan]} df = pd.DataFrame (data = d) ...
вопрос задан: 27 February 2019 15:32
3
ответа

Группировка панд по столбцу 1 и добавление разделенных запятыми записей из столбца 2

У меня есть фрейм данных Pandas с примерно 5 миллионами строк с 2 столбцами "top_level_domain" и "category". Я хотел бы создать новый фрейм данных с различными top_level_domain и ...
вопрос задан: 16 January 2019 12:04
3
ответа

Как я могу получить первый столбец из группы? Python Panda [дубликат]

Вот код. import pandas as pd df = pd.DataFrame ({«Возраст»: [0,0,1,14,15,30,31,50,51,79,78,45,22,15,80]}) print ( df ['Age']) a = df.groupby (['Age']). size () print (a) Выход: Возраст 0 2 1 1 ...
вопрос задан: 7 November 2015 11:19
3
ответа

pandas: создавать разные типы агрегации для одного и того же столбца [duplicate]

У меня есть следующий код, который отлично работает. df_1 = df.groupby (['team']) ['member']. apply (lambda x: x.tolist ()). reset_index () df_2 = df.groupby (['team']). agg ({ член ':'.. Количество '}) reset_index () переименовать (...
вопрос задан: 25 January 2013 22:26
2
ответа

Панды группового транспонирования

У меня есть файл от SAP, который не был самым красивым при работе с данными. Поэтому, используя series.str.contains () и логические маски, мне удалось сузить область данных до следующей:
вопрос задан: 24 March 2019 15:17
2
ответа

Избегайте итерации по каждой строке в Pandas для пользовательской агрегации

Допустим, у меня есть DataFrame для панд с двумя столбцами: salary и food_perc (процент от зарплаты, которую вы тратите на еду). Каждый ряд соответствует другому человеку. импорт панд как pd импорт numpy ...
вопрос задан: 6 March 2019 21:57
2
ответа

Получение последнего значения от группы в пандах

У меня есть датафрейм со следующей структурой. AccountRating | AccountRatingDate | AmountOutstanding | AmountPastDue Джон Сноу Закрыт 2017-03-01 0 ...
вопрос задан: 27 February 2019 15:11
2
ответа

Как сгруппировать по столбцу и сделать нормализацию?

Предположим, у меня есть дата: A B C 0 foo one 1 1 bar one 2 2 foo два 1 3 bar три 2 4 foo два 3 5 bar два 5 6 foo one ...
вопрос задан: 18 January 2019 15:45
2
ответа

Бин столбец по временным интервалам и рассчитать сумму

У меня есть панды DataFrame: df = pd.DataFrame ({"computer": [0, 1, 2, 3, 0, 1, 2, 3], "time": [0, 0, 1, 1, 2, 3, 4, 5], "value": [4, 1, 5, 6, 1, 0, 3, 4],}) df ["time"] = pd ....
вопрос задан: 17 January 2019 19:16
2
ответа

Столбец Groupby хранит несколько строк с минимальным значением

У меня есть датафрейм, состоящий из двух столбцов с идентификаторами и одного столбца с числовыми значениями. Я хочу сгруппировать по первому столбцу id и сохранить все строки, соответствующие наименьшим значениям в ...
вопрос задан: 17 January 2019 12:54
2
ответа

Как игнорировать максимальное и минимальное количество строк при применении функции description к группе панд

Я использую функцию pandas groupby и пытаюсь получить описание сгруппированных результатов, но без максимальной и минимальной строки каждой группы. Я не могу найти правильный ответ на мой вопрос. данные = {'...
вопрос задан: 17 January 2019 09:47
2
ответа

Столбцы GroupBy на префиксе заголовка столбца

У меня есть датафрейм с именами столбцов, которые начинаются с заданного списка префиксов. Я хочу получить сумму значений в кадре данных, сгруппированных по столбцам, которые начинаются с того же префикса. df = pd.DataFrame (...
вопрос задан: 16 January 2019 17:55
2
ответа

Преобразование данных в кадре данных Pandas [дубликат]

Я импортирую лист Excel в Dataframe. Когда вы вызываете dtypes в python, я получаю столбец как объект. Я поворачиваю его, чтобы плавать с функцией, а затем .apply () Когда я делаю df.groupby (['A']) ['...
вопрос задан: 10 June 2018 18:57
2
ответа

Как сравнить два столбца в python? [Дубликат]

У меня две серии: count_by_ncm 0 1 61112000 1904 63026000 412 62052000 314 61051000 265 62092000 215 count_by_ncm18: ncm quant 1012100 1 1012900 1 1013000 1 1019000 1 1022110 1 ...
вопрос задан: 5 May 2017 22:57
2
ответа

Значение Python DataFrame Groupby и Count для каждого класса [duplicate]

Я хочу подсчитать значения для класса foreach для столбца набора данных. Например, Col1 Col2 A Class1 A Class2 B Class2 B Class1 B Class2 C Class1 C Class2 C Class2 C Class1 How ...
вопрос задан: 21 October 2015 23:52
2
ответа

как дезагрегировать совокупный кадр данных pandas в python [duplicate]

Я хочу вычислить значение | сумма | любое user_Defined для col5, когда данные сгруппированы по [col1, col2, col3] и сохраняют эти значения в новом столбце say col6. Мне нужна общая функция для всех из них, о которой я упоминал выше. ...
вопрос задан: 27 February 2014 17:27
2
ответа

Результат Groupby не возвращает сгруппированный столбец, следовательно, ошибки при использовании countplot [duplicate]

Мои данные группируются правильно. df_RFQ_by_Salesperson = df [(df ['state']. str.contains ('Done'))] [['sales_person_name2', ...
вопрос задан: 14 February 2014 01:32
2
ответа

Pandas .groupby () заполнить групповую переменную [duplicate]

У меня есть Pandas Dataframe, который записывает красивые дни за город. df = pd.DataFrame ({'city': ['London', 'London', 'London', 'Paris', 'Paris', 'Paris'] 'date': [01.01.2018, 02.01.2018, 12.01 .2018, 02.01 ....
вопрос задан: 4 September 2013 22:38