У меня трудности с извлечением значений из словаря. Словарь включает в себя список, который содержит пару числовых значений, которые представляют интерес, и я намерен извлечь их и сохранить ...
Я пытаюсь выполнить операции ниже, которые работают нормально, за исключением проблемы с R, не признающей пустые ячейки пустыми Эта ошибка появляется, когда R жалуется, что существует более двух факторов; ...
У меня есть DataFrame, который содержит псевдо-вложенные столбцы (то есть, как имя), созданные с помощью функции Панды 'json_normalize' во вложенном JSON. Я хотел бы построить JSON из DataFrame, который имеет ...
У меня проблема с подготовкой данных, у меня есть два кадра данных временных рядов, которые я хочу объединить в 30-минутный интервал. Первый набор данных находится в 10-минутном интервале, в то время как другие в 15 ...
У меня есть набор информационных фреймов, которые представляют сценарии спроса, которые я поместил в словарь. Мне нужно перебрать каждый фрейм данных в словаре для переиндексации и повторной выборки и т. Д. И возврата к ...
У меня есть dataFrame, и мне нужно удалить дубликаты на группу ('col1') на основе минимального значения в другом столбце 'abs (col1 - col2)', но мне нужно изменить это условие для последней группы, взяв ...
Как я могу хранить мудрые строки данных в pandas dataframe с предопределенными именами столбцов через цикл? Это для извлечения текста из изображений. df = pd.DataFrame (columns = ['Col1', 'Col2', 'Col3', 'Col4', 'Col5' ...
У меня есть следующие серии ZAR, которые содержат метки времени: В [743]: Zar Out [743]: 0 2019-01-01 1 2019-03-21 2 2019-04-19 3 2019-04-22 4 2019-04 27 5 2019-05-01 6 2019-06-17 7 2019-08 -...
У меня есть список времен отсечения = 16: 30: 00.100, 16: 30: 00.200, 16: 30: 00.350, 16: 30: 00.450] И мои наблюдения таковы: 16: 30: 00.095 A 16: 30: 00.097 B 16: 30: 00.122 C 16: 30: 00.255 ...
У меня есть 12000 CSV-файлов, каждый файл имеет 6000 строк. я использую для цикла в моем коде, я думаю, из-за этого мое время выполнения кода увеличилось. если кто-нибудь знает, как изменить этот кусок кода в ...
У меня есть функция: def func (df): #does вещи, возвращающие df Возвращенный DataFrame выглядит следующим образом, когда я ввожу dataframe: x1 x2 x3 ret vol Я хочу изменить имя ...
Представьте, что у меня есть датафрейм с 9 столбцами. Я хочу иметь возможность добиться того же эффекта, что и df.hist (), но с помощью sns.distplot (). Другими словами, я хочу быть в состоянии построить sns.distplot () для каждого ...
Я запускаю следующий код и получаю желаемый вывод для одного DataFrame, a: a = a.reset_index () a ['count'] = 1 a = pd.DataFrame (a.groupby (['country', 'id', 'town', 'date']) ['count']. mean ()) a = a.groupby ([...
У меня есть объект GroupBy. Я хочу удалить строки из текущей группы, если такая же строка существует в предыдущей группе. Допустим, это (n-1) -я группа: A B 0 foo 0 1 baz 1 2 foo 1 3 bar 1 ...
Я пытаюсь получить промежуточный итог, используя поворот панд. Я не знаю, почему я получаю только промежуточный итог колонки? data = {'TypeOfInvestor': ['Акции', 'Облигации', 'Недвижимость'], 'InvestorA': [96, ...
Я пытаюсь применить простое значение к столбцу в моем фрейме панды, но всегда показывает NaN, я не могу найти причину, почему. вот мой код def get_extra_hours (value): вернуть f '{value [12] -40: .2f}' ...
Я хотел бы заполнить недостающее значение в 2 столбца. Есть Date и Cat2 должны быть заполнены значением другой строки на основе последней даты для предопределенного Cat1 (предопределенного в предыдущих заполненных строках),
Я хочу, чтобы оценить население ER в час. определение следующее: толпа (час = х) = люди, которые не были выписаны (час = х-1) + люди, которые присоединились (час = х) - люди, которые были выписаны (час = х)
Я использую отчеты НЛО в пандах. Я хочу, чтобы состояние, которое имеет форму, сообщило "овальный" ... поэтому я пишу: ufo.groupby ("State"). Shape_Reported == "Oval" Это показывает мне False как вывод .. pls помогите мне.pls
У меня есть датафрейм (df), скажем, он имеет 12 столбцов. Мне нужно построить диаграммы рассеяния 11 из этих столбцов (мои независимые переменные) относительно одного столбца (моя зависимая переменная). Другими словами, если ...
У меня есть данные формы [600 000, 19]. Я хочу отфильтровать первые 100 000 строк на основе одного условия, следующие 300 000 строк на основе другого условия и 3-е условие для последних строк. Я был ...
Существует огромная разница между пандами "isin" и numpy "in1d" с точки зрения эффективности. После некоторых исследований я заметил, что тип данных и значений, которые передаются в качестве параметра в "...
У меня есть парные ключи / значения в виде переменных (datetime / object), и у меня возникают проблемы с добавлением заголовка и dtypes к типам данных. Я могу сделать dataframe без заголовков столбцов и dtype объекта ...
У меня есть pandas dataframe, который имеет как float, так и numpy массивы, как показано ниже. имя x1 x2 X3 0 a 4.7 [0.] 3 1 b 3.2 [1.7] 5 2 e 1.2 [2.] 6 I ...
Я не могу преобразовать этот код в df. Я пробовал df = pd.read_json ('australian_user_reviews.json') и у меня ошибка: ValueError: Ожидаемый объект или значение {'user_id': '76561197970982479', 'user_url': 'http: / / ...
Я использую следующий код, чтобы попытаться создать фрейм данных из векторизатора Tf-Idf. Вывод векторизатора fit_transform представляет собой разреженную матрицу, поэтому я использую toarray () для преобразования в массив, а затем в pandas ....