pandas - список вопросов по программированию pandas

1

ответ

Как извлечь параметры из списка в словаре в отдельные столбцы как числа с плавающей запятой?

У меня трудности с извлечением значений из словаря. Словарь включает в себя список, который содержит пару числовых значений, которые представляют интерес, и я намерен извлечь их и сохранить ...

python pandas csv

вопрос задан: 30 March 2019 23:07

1

ответ

Как создать пустые ячейки в пандах, которые R распознает как пустые, используя rpy2?

Я пытаюсь выполнить операции ниже, которые работают нормально, за исключением проблемы с R, не признающей пустые ячейки пустыми Эта ошибка появляется, когда R жалуется, что существует более двух факторов; ...

python r pandas numpy dataframe

вопрос задан: 30 March 2019 22:43

1

ответ

Как я могу заменить df.iterrows () на df.apply () в Pandas?

У меня есть следующий цикл: dict1 = {} dict2 = {} для (я, строка) в DF [['Col1', 'Col2', 'Col3']]. ']] = строка [' col2 '] dict2 [строка [' col1 ']] = строка [' col3 '] ...

python pandas

вопрос задан: 29 March 2019 12:10

1

ответ

Из & ldquo; nested & rdquo; DataFrame для вложенного Json [дубликата]

У меня есть DataFrame, который содержит псевдо-вложенные столбцы (то есть, как имя), созданные с помощью функции Панды 'json_normalize' во вложенном JSON. Я хотел бы построить JSON из DataFrame, который имеет ...

python json pandas

вопрос задан: 29 March 2019 11:59

1

ответ

Как объединить кадры данных временных рядов, 15 минут и 10 минут, в 30 минут

У меня проблема с подготовкой данных, у меня есть два кадра данных временных рядов, которые я хочу объединить в 30-минутный интервал. Первый набор данных находится в 10-минутном интервале, в то время как другие в 15 ...

pandas data-science

вопрос задан: 29 March 2019 10:17

1

ответ

Цикл по словарю фреймов данных

У меня есть набор информационных фреймов, которые представляют сценарии спроса, которые я поместил в словарь. Мне нужно перебрать каждый фрейм данных в словаре для переиндексации и повторной выборки и т. Д. И возврата к ...

python pandas dictionary for-loop python-xarray

вопрос задан: 28 March 2019 17:01

1

ответ

Как drop_duplicate, используя разные условия для группы?

У меня есть dataFrame, и мне нужно удалить дубликаты на группу ('col1') на основе минимального значения в другом столбце 'abs (col1 - col2)', но мне нужно изменить это условие для последней группы, взяв ...

python pandas grouping drop-duplicates

вопрос задан: 28 March 2019 14:10

1

ответ

Как обновить столбец панд, если они имеют одинаковое значение столбцов?

Допустим, у меня есть два оригинальных DataFrame, таких как: df1 = pd.DataFrame ({"ID": [101, 102, 103], "Price": [12, 33, 44], "нечто": [12,22, 11]}) df2 = pd.DataFrame ({"ID": [101, 103], "Price": [122, 133]}) ...

python pandas dataframe

вопрос задан: 28 March 2019 08:27

1

ответ

Как преобразовать список в DataFrame по строкам

Как я могу хранить мудрые строки данных в pandas dataframe с предопределенными именами столбцов через цикл? Это для извлечения текста из изображений. df = pd.DataFrame (columns = ['Col1', 'Col2', 'Col3', 'Col4', 'Col5' ...

python python-3.x pandas

вопрос задан: 28 March 2019 07:34

1

ответ

Pandas Dataframe заменяет Nan из строки, когда значение столбца соответствует

У меня есть датафрейм, т. Е. Входной класс данных фрейма, подклассы школы, города 0 I A Eng 80 jghss salem 1 I A Mat 90 jghss salem 2 I A ...

python python-3.x pandas nan

вопрос задан: 28 March 2019 05:35

1

ответ

Оператор `in` не работает должным образом при проверке, содержит ли серия панд заданное значение

У меня есть следующие серии ZAR, которые содержат метки времени: В [743]: Zar Out [743]: 0 2019-01-01 1 2019-03-21 2 2019-04-19 3 2019-04-22 4 2019-04 27 5 2019-05-01 6 2019-06-17 7 2019-08 -...

python pandas datetime

вопрос задан: 28 March 2019 04:58

1

ответ

Группировка наблюдений по времени отключения

У меня есть список времен отсечения = 16: 30: 00.100, 16: 30: 00.200, 16: 30: 00.350, 16: 30: 00.450] И мои наблюдения таковы: 16: 30: 00.095 A 16: 30: 00.097 B 16: 30: 00.122 C 16: 30: 00.255 ...

python-3.x pandas

вопрос задан: 28 March 2019 03:47

1

ответ

Как сократить время выполнения программы, заменив цикл в пандах

У меня есть 12000 CSV-файлов, каждый файл имеет 6000 строк. я использую для цикла в моем коде, я думаю, из-за этого мое время выполнения кода увеличилось. если кто-нибудь знает, как изменить этот кусок кода в ...

python-3.x pandas

вопрос задан: 28 March 2019 03:47

1

ответ

Переименовать индекс для нескольких DataFrames

У меня есть функция: def func (df): #does вещи, возвращающие df Возвращенный DataFrame выглядит следующим образом, когда я ввожу dataframe: x1 x2 x3 ret vol Я хочу изменить имя ...

python pandas loops dataframe rename

вопрос задан: 28 March 2019 03:03

1

ответ

Как построить матрицу распределений Seaborn для всех столбцов в кадре данных

Представьте, что у меня есть датафрейм с 9 столбцами. Я хочу иметь возможность добиться того же эффекта, что и df.hist (), но с помощью sns.distplot (). Другими словами, я хочу быть в состоянии построить sns.distplot () для каждого ...

python pandas seaborn

вопрос задан: 28 March 2019 02:20

1

ответ

Цикл по нескольким DataFrames для выполнения одной и той же задачи

Я запускаю следующий код и получаю желаемый вывод для одного DataFrame, a: a = a.reset_index () a ['count'] = 1 a = pd.DataFrame (a.groupby (['country', 'id', 'town', 'date']) ['count']. mean ()) a = a.groupby ([...

python pandas loops dataframe

вопрос задан: 28 March 2019 01:26

1

ответ

Удалить строки, если они существуют в предыдущей группе

У меня есть объект GroupBy. Я хочу удалить строки из текущей группы, если такая же строка существует в предыдущей группе. Допустим, это (n-1) -я группа: A B 0 foo 0 1 baz 1 2 foo 1 3 bar 1 ...

python pandas pandas-groupby

вопрос задан: 28 March 2019 01:23

1

ответ

Почему я не получаю промежуточный итог строк

Я пытаюсь получить промежуточный итог, используя поворот панд. Я не знаю, почему я получаю только промежуточный итог колонки? data = {'TypeOfInvestor': ['Акции', 'Облигации', 'Недвижимость'], 'InvestorA': [96, ...

pandas crosstab subtotal

вопрос задан: 28 March 2019 01:20

1

ответ

добавить значение в столбец из функции .apply

Я пытаюсь применить простое значение к столбцу в моем фрейме панды, но всегда показывает NaN, я не могу найти причину, почему. вот мой код def get_extra_hours (value): вернуть f '{value [12] -40: .2f}' ...

pandas

вопрос задан: 27 March 2019 15:08

1

ответ

Python - заполнить NA значением из предыдущих строк на основе столбца идентификатора

Я хотел бы заполнить недостающее значение в 2 столбца. Есть Date и Cat2 должны быть заполнены значением другой строки на основе последней даты для предопределенного Cat1 (предопределенного в предыдущих заполненных строках),

python pandas dataframe fillna pandas-fillna

вопрос задан: 27 March 2019 13:46

1

ответ

нужен умный цикл - сортируйте столбец DateTime и измеряйте скученность

Я хочу, чтобы оценить население ER в час. определение следующее: толпа (час = х) = люди, которые не были выписаны (час = х-1) + люди, которые присоединились (час = х) - люди, которые были выписаны (час = х)

pandas loops dataframe

вопрос задан: 27 March 2019 10:56

1

ответ

В пандах я использую отчеты НЛО. Я хочу получить состояние, которое сформировало отчетный овал.

Я использую отчеты НЛО в пандах. Я хочу, чтобы состояние, которое имеет форму, сообщило "овальный" ... поэтому я пишу: ufo.groupby ("State"). Shape_Reported == "Oval" Это показывает мне False как вывод .. pls помогите мне.pls

python-3.x pandas data-science

вопрос задан: 27 March 2019 09:13

1

ответ

Как построить точечную диаграмму, используя фрейм данных pandas, где значения оси x равны n минус 1 столбцу, а последний столбец является зависимой переменной?

У меня есть датафрейм (df), скажем, он имеет 12 столбцов. Мне нужно построить диаграммы рассеяния 11 из этих столбцов (мои независимые переменные) относительно одного столбца (моя зависимая переменная). Другими словами, если ...

python-3.x pandas matplotlib

вопрос задан: 27 March 2019 03:39

1

ответ

Изменить форму DataFrame с длинного на широкий вдоль одного столбца

Я ищу способ перенастроить приведенную ниже таблицу A в таблицу B. Таблица A: тип x1 x2 x3 A 4 6 9 A 7 4 1 A 9 6 2 B 1 3 8 B 2 7 9 ...

python python-3.x pandas

вопрос задан: 27 March 2019 00:23

1

ответ

Фильтр данных Pandas на основе условия для первых n строк

У меня есть данные формы [600 000, 19]. Я хочу отфильтровать первые 100 000 строк на основе одного условия, следующие 300 000 строк на основе другого условия и 3-е условие для последних строк. Я был ...

python pandas filtering condition

вопрос задан: 26 March 2019 23:40

1

ответ

панды & ldquo; isin & rdquo; намного медленнее, чем numpy & ldquo; in1d & rdquo;

Существует огромная разница между пандами "isin" и numpy "in1d" с точки зрения эффективности. После некоторых исследований я заметил, что тип данных и значений, которые передаются в качестве параметра в "...

pandas performance numpy benchmarking

вопрос задан: 26 March 2019 14:52

1

ответ

Не удается добавить заголовки столбцов к кадру данных при использовании to_dict () в пандах

У меня есть парные ключи / значения в виде переменных (datetime / object), и у меня возникают проблемы с добавлением заголовка и dtypes к типам данных. Я могу сделать dataframe без заголовков столбцов и dtype объекта ...

python pandas dictionary

вопрос задан: 26 March 2019 14:50

1

ответ

Как изменить тип данных значений в пандах

У меня есть pandas dataframe, который имеет как float, так и numpy массивы, как показано ниже. имя x1 x2 X3 0 a 4.7 [0.] 3 1 b 3.2 [1.7] 5 2 e 1.2 [2.] 6 I ...

pandas

вопрос задан: 26 March 2019 14:27

1

ответ

Конвертировать JSON в pd.DataFrame

Я не могу преобразовать этот код в df. Я пробовал df = pd.read_json ('australian_user_reviews.json') и у меня ошибка: ValueError: Ожидаемый объект или значение {'user_id': '76561197970982479', 'user_url': 'http: / / ...

python json pandas

вопрос задан: 25 March 2019 14:13

1

ответ

Ошибка экспорта в Pandas to_excel: объект DataFrame не имеет атрибута data

Я использую следующий код, чтобы попытаться создать фрейм данных из векторизатора Tf-Idf. Вывод векторизатора fit_transform представляет собой разреженную матрицу, поэтому я использую toarray () для преобразования в массив, а затем в pandas ....

python pandas scikit-learn tfidfvectorizer

вопрос задан: 25 March 2019 08:07