1
ответ

Как получить n-е наибольшие значения из определенного столбца с помощью groupby и выполнить вычисления для другого столбца в той же строке

У меня есть пандас dataframe dd: Позиция эксперимента ID круга Значение раздела Expt1 2000 104 127327203 2 52.01 Expt1 2000 105 127327203 2 51.78 Expt1 ...
вопрос задан: 11 April 2019 09:35
1
ответ

Удалить строки, если они существуют в предыдущей группе

У меня есть объект GroupBy. Я хочу удалить строки из текущей группы, если такая же строка существует в предыдущей группе. Допустим, это (n-1) -я группа: A B 0 foo 0 1 baz 1 2 foo 1 3 bar 1 ...
вопрос задан: 28 March 2019 01:23
1
ответ

Как объединить две группы по индексу

Мне нужно объединить две группы вместе. Как мне быть? Например: таблица1 индекс | столбец1 | столбец2 | значения 0 | | B | 10 1 | | ...
вопрос задан: 24 March 2019 13:47
1
ответ

Увеличение суммы с группой по дате

У меня есть датафрейм, в котором я пытаюсь сделать увеличивающуюся сумму значений и сгруппировать их по дате. В частности, мои данные выглядят так: creationDateTime OK Fail 2017-01-06 21:30:00 4 0 2017-01-06 ...
вопрос задан: 19 March 2019 09:13
1
ответ

Панды: сгруппированы по группам - IDE: Pycharm

QQ - IDE: Pycharm - я использую приведенный ниже формат образца данных. Название бизнес-сегментаID Маржа выручки OrderQuantity James Commercial 1001 1500 100 1 ...
вопрос задан: 6 March 2019 17:46
1
ответ

Группировка и агрегирование по нескольким столбцам при применении столбца в качестве аргумента агрегирования в Pandas?

Я пытаюсь сгруппировать ниже DataFrame на основе срока действия и забастовки. После этого я хотел бы рассчитать разницу между всеми коллами и путами с одинаковыми страйками и датой истечения. Ниже ...
вопрос задан: 23 February 2019 14:42
1
ответ

Невозможно использовать некоторые основные статистические функции в групповом агрегате Pandas.

У меня есть эксперимент, где «глубина» измеряется для различных «силы» и «скорости сканирования». Пять прогонов проводятся для каждого набора переменных. Я должен вычислить максимальную глубину, измеренную через ...
вопрос задан: 21 February 2019 03:35
1
ответ

Как объединить строки при сохранении всех строк и иметь одно значение результата на группу

Я пытаюсь сгенерировать уникальное групповое значение для каждого наблюдения, состоящего из содержимого столбца, объединенного вместе, при этом все строки остаются нетронутыми. У меня есть наблюдения, которые можно сгруппировать ...
вопрос задан: 18 January 2019 14:12
1
ответ

Суммирование определенных столбцов на основе сопоставления

У меня есть ряд, который содержит сопоставление: serm = pd.Series (data = {'ARD1': 53, 'BUL1': 37, 'BUL2': 37, 'BSR1': 49, 'BTR1': 53, 'CR1 ': 53,' CRR1 ': 53,' CRE3 ': 53,' TAB1 ': 52,' NEP1 ': 42,' HAL1 ': 42}) ...
вопрос задан: 18 January 2019 08:56
1
ответ

Цвет гистограммы панд / матплотлиб по условию

Я пытаюсь составить гистограмму баллов учеников по домашним заданиям, используя pandas / matplotlib. Я могу сделать гистограмму без проблем, но я бы хотел выбрать цвет по баллу студента ....
вопрос задан: 17 January 2019 16:58
1
ответ

Python Pandas продолжают группироваться после применения

У меня есть датафрейм Pandas, похожий на этот | Ind | C1 | C2 | .... | Cn | | ----------------------- | | 1 | val1 | AE | .... | время | | ----------------------- | | 2 | val2 | FB | .... | время | | ----------------...
вопрос задан: 16 January 2019 10:09
1
ответ

Группа панд по времени с указанным временем начала с нецелыми минутами

У меня есть датафрейм с часами сигналов. Я хочу сгруппировать их в 10-минутные ведра. Проблема в том, что время запуска не является «кратным» 10 минутам, поэтому вместо
вопрос задан: 15 January 2019 21:02
1
ответ

Как получить несколько окон, содержащих несколько графиков, используя matplotlib?

У меня есть 200 продуктов, и я хочу построить график зависимости времени от параметров. Я придумал код, который строит графики для 20 продуктов и отображает их в одном окне. Я хотел бы знать, если есть способ ...
вопрос задан: 15 January 2019 15:55
1
ответ

Как группировать по трем столбцам, используя условия в Pandas (Python)?

Привет, поэтому я в настоящее время работаю с фреймом данных, который имеет следующие столбцы: User_id (имеет более 30 типов повторяющихся идентификаторов пользователя): 1,22,33,3,1,222,1,3 и т. Д. Столбец1 (имеет две категории ): A, B, A, ...
вопрос задан: 13 July 2018 21:35
1
ответ

Панды находят продолжительность между датами, где выполняется условие?

У меня есть pandas DataFrame, который выглядит так: ╔ = = = = = = = = = = = = = = = = = = = ════════════════════════════════════════════════════════════════════════════════════════════════════
вопрос задан: 13 July 2018 14:31
1
ответ

Вставьте дополнительные столбцы в группу pandas [duplicate]

У меня очень длинный Pandas DataFrame (около 10K строк), но я предоставляю упрощенный DataFrame в качестве примера: df = pd.DataFrame ({«STUDENT»: [1, 2, 3, 4, 5], «SCHOOL»: [11, 11, ...
вопрос задан: 14 March 2018 02:55
1
ответ

Преобразование строк в столбцы и одно горячее кодирование в Pandas [duplicate]

У меня есть dataframe вот так: customer_id | дата | категория 1 | 2017-2-1 | игрушки 2 | 2017-2-1 | питание 1 | 2017-2-1 | напитки 3 | 2017-2-2 | компьютер 2 ...
вопрос задан: 13 November 2017 07:20
1
ответ

Как убедиться, что определенные элементы добавляются, когда выборка данных в pandas [duplicate]

Мой Pandas Dataframe выглядит так: | id | имя | состояние | категория | brand_name | цена ------------------------------------------------- ---- | 1 | Рубашка | 3 | Мужские сгустки | Легко | 250 ...
вопрос задан: 3 April 2016 19:54
1
ответ

Нельзя использовать ось secondary_y с matplotlib [duplicate]

У меня есть DF с сгруппированными данными, такими как: fieldsX = ['Year_start', 'Week_start'] f = {'Integrado': ['count'], 'Duration_hours': ['min', 'mean', 'max' ]} a = a.groupby (fieldsX) .agg (f) Это фрагмент ...
вопрос задан: 1 November 2015 00:55
1
ответ

Pandas groupby column1 применяет max к столбцу2 и соответствующему значению столбца 3 в результате [duplicate]

У меня есть следующий фреймворк данных: d = {'item_code': ['Item1', 'Item2', 'Item3', 'Item1', 'Item2', 'Item2', 'Item2', 'Item1', 'Item3'] , 'dollar_amount': ['200.25', '350.00', '120.00', '400.50', '1231.25' ...
вопрос задан: 8 September 2015 13:37
1
ответ

Получить строку агрегированного фрейма данных по значению [duplicate]

У меня есть dataframe, «ответы» следующим образом: campaign_type contact_id Email 0031B00002cPLuFQAW Отчет аналитика 0031B00002eP5ijQAC Operational 003a000001nHioCAAS ...
вопрос задан: 14 February 2014 01:32
0
ответов

Пример каждой группы после группы панд

Я знаю, что на это, должно быть, ответили кое-где, но я просто не мог найти это. Проблема: образец каждой группы после групповой операции. импортировать панд как pd df = pd.DataFrame ({'a': [1,2,3,4,5,6,7], ...
вопрос задан: 2 July 2019 15:16
0
ответов

Как получить количество групп в объекте groupby в пандах?

Это было бы полезно, так что я знаю, сколько уникальных групп я должен выполнить вычисления. Спасибо. Предположим, объект groupby называется dfgroup.
вопрос задан: 11 June 2019 04:26
0
ответов

Отфильтруйте фрейм данных и добавьте новый столбец в соответствии с заданным условием.

У меня есть фрейм данных, подобный этому ID col1 col2 1 Abc street 2017-07-27 1 Нет 2017-08-17 1 Def street 2018-07-15 1 Нет 2018-08-13 2 ...
вопрос задан: 14 May 2019 03:55
0
ответов

Сохранить форму после группового

Итак, допустим, у меня есть df, который является частотой животных в разных домах: Частота животных 0 Собака 5 1 Кошка 7 2 Кошка 2 3 Рыба 2 4 Собака 8 Теперь допустим, что мне все равно ...
вопрос задан: 29 March 2019 12:19
0
ответов

Ошибка при попытке & ldquo; groupby & rdquo; этот проект через панд в питоне

Я хочу построить систему рекомендаций и следовать учебнику. Я пытаюсь сгруппировать эти столбцы, но у меня куча странных ошибок, и я не могу понять, почему. импортировать numpy как np импортировать pandas как pd ...
вопрос задан: 27 March 2019 13:38
0
ответов

рассчитать различия по группам в данных со сбросом на границе группы

Может производить diff () между строками по группам, но нужно эффективно начинать следующую группу с 0 diff. В настоящее время дайте различие от последней из предыдущей группы. csvin [ 'пробел'] = csvin.groupby ([ 'SYM' ...
вопрос задан: 26 March 2019 19:32
0
ответов

Dask Dataframe: определение меты для различий в датах

Я пытаюсь найти время между покупками (то есть, дни между заказами) для клиентов. Хотя мой код работает правильно без определения мета, я бы хотел, чтобы он работал правильно и больше не ...
вопрос задан: 26 March 2019 17:56
0
ответов

Панды получают 30-дневное скользящее окно в течение n лет

Я пытаюсь получить 30-дневное окно, идущее назад от всех дат в кадре данных, но также смотрю на одно и то же 30-дневное окно для всех лет в наборе данных. Даты с 2000-2019. Для ...
вопрос задан: 11 March 2019 15:01
0
ответов

Групповой запрос

для группы, кадр в df.groupby ('STNAME'): avg = np.average (frame ['CENSUS2010POP']) Что представляет собой кадр в groupby, является ли он конкретным столбцом? Если мы сделаем это, как показано ниже, то это даст состояние ...
вопрос задан: 11 March 2019 14:50