Я относительно новичок в пандах, и мне трудно создать новый столбец на основе суммированной группы. Вот фрагмент моего набора данных: В [1478]: mkt_vals_joined [['GameId', 'Year', 'HomeTeam', '...
У меня есть несколько фреймов данных, и я просто хотел отфильтровать столбец, который имеет хотя бы значение и хотел бы удалить столбцы, содержащие только значения NA. Я пробовал с кодом ниже, но я ...
Я делаю «Что готовит?» Kaggle вызов, и у меня есть dataframe, который имеет три столбца (обратите внимание, что последний содержит список): кухня id ингредиенты 0 греческий 10259 [romaine ...
У меня есть Dataframe цен на акции, основанный на индексе datetime (3 года) для примерно 20 компаний и символов. Данные выглядят следующим образом: & lt; bound method NDFrame.head даты закрытия тикера ...
У меня есть dataframe с 1K строк, я хочу объединить строки, имеющие одинаковое имя, ID, Контекст в одном, например. Фактический идентификатор Dataframe Название Conc Val1 Val2 1 XYZ 10 0 1 XYZ 0 20 2 ABC ...
Я сгруппировал некоторые данные по одному столбцу: mcnfecha mcnvalcred 872 2015-12-31 3310750.00 871 2015-12-31 3290000.00 870 2015-12-31 3274402.00 869 2015-12-31 3253600.00 ...
У меня есть набор данных, который выглядит так: yg = pd.DataFrame ({'grade': ['a', 'a', 'b', 'b', 'a'], 'key2': ['one ',' 2 ',' one ',' two ',' one '],' year ': (2012,2013,2012,2012, ...
По сути, я использую группу в пандах, которая обеспечивает подсчет для определенных групп данных - отлично работает! Тем не менее, мой код не даст мне счет «0» за четверть игры, когда ...
Как сохранить фрейм данных из вывода из группы pandas как что-то вроде вывода 2, приведенного ниже, без отображения обеих категорий в первом столбце (я думаю, что это индекс). Код ниже ...
У меня есть следующий фрейм данных, для которого я использую groupby и sum (): d = {'col1': ["A", "A", "A", "B", "B", "B", "C" , "C", "C"], 'col2': [1,2,3,4,5,6, np.nan, np.nan, np.nan]} df = pd.DataFrame (data = d) ...
У меня есть фрейм данных Pandas с примерно 5 миллионами строк с 2 столбцами "top_level_domain" и "category". Я хотел бы создать новый фрейм данных с различными top_level_domain и ...
У меня есть следующий код, который отлично работает. df_1 = df.groupby (['team']) ['member']. apply (lambda x: x.tolist ()). reset_index () df_2 = df.groupby (['team']). agg ({ член ':'.. Количество '}) reset_index () переименовать (...
У меня есть файл от SAP, который не был самым красивым при работе с данными. Поэтому, используя series.str.contains () и логические маски, мне удалось сузить область данных до следующей:
Допустим, у меня есть DataFrame для панд с двумя столбцами: salary и food_perc (процент от зарплаты, которую вы тратите на еду). Каждый ряд соответствует другому человеку. импорт панд как pd импорт numpy ...
У меня есть датафрейм, состоящий из двух столбцов с идентификаторами и одного столбца с числовыми значениями. Я хочу сгруппировать по первому столбцу id и сохранить все строки, соответствующие наименьшим значениям в ...
Я использую функцию pandas groupby и пытаюсь получить описание сгруппированных результатов, но без максимальной и минимальной строки каждой группы. Я не могу найти правильный ответ на мой вопрос. данные = {'...
У меня есть датафрейм с именами столбцов, которые начинаются с заданного списка префиксов. Я хочу получить сумму значений в кадре данных, сгруппированных по столбцам, которые начинаются с того же префикса. df = pd.DataFrame (...
Я импортирую лист Excel в Dataframe. Когда вы вызываете dtypes в python, я получаю столбец как объект. Я поворачиваю его, чтобы плавать с функцией, а затем .apply () Когда я делаю df.groupby (['A']) ['...
Я хочу подсчитать значения для класса foreach для столбца набора данных. Например, Col1 Col2 A Class1 A Class2 B Class2 B Class1 B Class2 C Class1 C Class2 C Class2 C Class1 How ...
Я хочу вычислить значение | сумма | любое user_Defined для col5, когда данные сгруппированы по [col1, col2, col3] и сохраняют эти значения в новом столбце say col6. Мне нужна общая функция для всех из них, о которой я упоминал выше. ...
У меня есть Pandas Dataframe, который записывает красивые дни за город. df = pd.DataFrame ({'city': ['London', 'London', 'London', 'Paris', 'Paris', 'Paris'] 'date': [01.01.2018, 02.01.2018, 12.01 .2018, 02.01 ....