pandas - список вопросов по программированию pandas

2

ответа

в Pandas (Python), как добавить столбец с groupby, на который ссылаются два столбца

Я пытаюсь добавить столбец в Pandas GroupBy DataFrame. Новый столбец (E) представляет собой сумму значений в столбце (C) с тем же ключом (A, B). Этот ключ состоит из двух других столбцов кадра данных (A, B) ....

pandas python

вопрос задан: 16 January 2019 21:13

2

ответа

Панды: Любые () Все () с if / else

Я пытаюсь сделать простое утверждение if / else на фрейме данных Pandas. Я получил ошибку. Значение истины серии неоднозначно. поэтому я попытался использовать any () all (). Использование этих параметров вызывает только ...

python pandas

вопрос задан: 16 January 2019 20:14

2

ответа

Как преобразовать фрейм данных в & ldquo; ColumnName1 | Value1 \ r \ n ColumnName2 | Value2 \ r \ n ColumnName3 | Value3 & Rdquo; так далее

У меня есть пандас dataframe, состоящий из 11 столбцов и 1 строки. Мне нужен конечный вывод, чтобы перейти от: Введите ID С К XYZ 999 Тони Энди К: Тип | XYZ ID | 999 С | Тони К | Энди Результатом будет ...

jupyter-notebook pandas python export-to-csv python-3.x

вопрос задан: 16 January 2019 19:36

2

ответа

Столбцы GroupBy на префиксе заголовка столбца

У меня есть датафрейм с именами столбцов, которые начинаются с заданного списка префиксов. Я хочу получить сумму значений в кадре данных, сгруппированных по столбцам, которые начинаются с того же префикса. df = pd.DataFrame (...

pandas dataframe group-by pandas-groupby python

вопрос задан: 16 January 2019 17:55

2

ответа

Выберите данные на основе нескольких критериев с помощью панд

Я новичок в использовании панд. Я хочу выбрать строки в кадре данных, где несколько столбцов совпадают по значению. Вдоль строк: если столбец A равен столбцу AB, а столбец B равен столбцу BC, тогда я хочу ...

python pandas select

вопрос задан: 16 January 2019 17:11

2

ответа

Панды: как суммировать наборы данных неравного размера?

Допустим, у меня есть наборы данных различного размера, например, X_1 = [1,2,3] и X_2 = [4,5,6,7,8]. Я хотел бы создать фрейм данных со сводными переменными (mean, std и т. Д.), С одним набором данных на строку и далее ...

python pandas

вопрос задан: 16 January 2019 16:41

2

ответа

Панды не считают строки должным образом

Итак, у меня есть этот фрейм данных: имя файла ширина высота класс xmin ymin xmax ymax 0 128782.JPG 640 512 Panel 36 385 119 510 1 128782.JPG 640 512 Panel ...

python string pandas

вопрос задан: 16 January 2019 15:01

2

ответа

заменить последующий символ, если значения ряда содержат определенный набор символов в пандах

У меня есть такой фрейм данных: df: col1 col2 col3 1 123xy56 pyrxyz 3 hcv P xy12 R T 5 453xy Z 2 lxy6 Q I ...

python pandas dataframe

вопрос задан: 16 January 2019 14:47

2

ответа

Применить функцию к кадру данных на основе столбца с другим кадром данных на основе индекса

Я хотел бы выполнить некоторую операцию (например, x * яблок ^ y) над значениями яблок столбца, основываясь на их цвете. Соответствующие значения находятся в отдельном фрейме данных: import pandas as pd import numpy ...

python pandas numpy

вопрос задан: 16 January 2019 14:45

2

ответа

Как удалить строки из фрейма данных Pandas, если такая же строка существует в другом фрейме данных, но в итоге все столбцы из обоих df

У меня есть два разных фрейма данных Pandas, которые имеют один общий столбец. Я видел похожие вопросы о переполнении стека, но ни один из них, по-видимому, не заканчивался столбцами из обоих фреймов, поэтому, пожалуйста ...

python pandas

вопрос задан: 16 January 2019 14:22

2

ответа

Панды to_csv преобразует столбец str в int (или с плавающей точкой)

Как без названия, я заметил, что pandas 'to_csv' автоматически преобразует столбцы, в которых есть только буквенно-цифровые строки для плавания. Я создаю кадр данных в блокноте Jupyter и создаю столбец ...

pandas csv python

вопрос задан: 16 January 2019 12:57

2

ответа

Как разбить столбец на несколько столбцов в пандах с определенной позицией разделителя?

вот мой фрейм данных df_test 0 (-, 136), (-, 136), 1,0 1 (-, 136), (-, 438), 0,5 2 (-, 136), (-, 257), 0,5 хотелось бы чтобы увидеть результат, как это df_t1 df_t2 ...

python pandas

вопрос задан: 16 January 2019 11:37

2

ответа

Как получить второе по величине значение в Pandas Python [дубликат]

Это мой код: maxData = all_data.groupby (['Id']) [features] .agg ('max') all_data = pd.merge (all_data, maxData.reset_index (), суффиксы = ["", "_max" ], how = 'left', on = ['Id']) Теперь вместо получения ...

python pandas

вопрос задан: 16 January 2019 10:38

2

ответа

Python - Как создать новые столбцы на основе расчетов одного столбца. Расчет флагов UserAccountControl

У меня есть следующий пример фрейма данных: column1, column2, column3 tom, 0100,544 tim, 0101,514 ben, 0899,1512 Третий столбец содержит useraccountcontrolflag, и каждая строка представляет одну запись пользователя ....

pandas python

вопрос задан: 16 January 2019 09:30

2

ответа

Преобразуйте вложенный DataFrame с отсортированными уникальными значениями во вложенный словарь в Python

Я пытаюсь взять вложенный DataFrame и преобразовать его во вложенный словарь. Вот мой оригинальный DataFrame со следующими уникальными значениями: input: df.head (5) output: reviewerName ...

python pandas dataframe nested dictionary

вопрос задан: 16 January 2019 08:45

2

ответа

Найти корреспондентов в фреймах данных для расчета

Два кадра данных, как показано ниже, и я хочу рассчитать коэффициент корреляции. Он отлично работает, когда оба столбца заполнены фактическими значениями. Но когда они не, это берет ноль как ценность, когда ...

python pandas dataframe correlation

вопрос задан: 16 January 2019 06:08

2

ответа

Мой фрейм данных возвращает 0 строк, но при использовании фильтров в электронной таблице Excel отображаются строки

Мой фрейм данных не возвращает строки в соответствии с фильтром даты, но когда я открываю один и тот же файл в электронной таблице Excel и использую фильтры, я могу получить данные. Что я делаю неправильно? Приложения для ...

data-science pandas python

вопрос задан: 16 January 2019 01:45

2

ответа

Как проверить, присутствует ли вложенный список, а если нет, вкладывать?

У меня есть одна строка df, которая выглядит следующим образом: теги id 1 [[[band_music, fun], tv], movies] Иногда в зависимости от источника df может выглядеть так: теги id 1 [[[...

python-3.x pandas dataframe nested

вопрос задан: 16 January 2019 00:34

2

ответа

Получение имен столбцов и количества пустых значений из df.info () pandas

У меня есть пандас DataFrame с именем df: df = {'a': [1, NaN, 2, NaN]}, ... 'b': [1, 5, 6, 6]} Я хочу список кортежей, каждый кортеж, содержащий: (column_name, #_non_null ...

dataframe pandas python

вопрос задан: 15 January 2019 22:09

2

ответа

Как объединить один столбец данных Pandas с датой, а другой - со временем?

Я работаю с CSV, у которого есть два столбца, один с датой в формате месяц / день / год (например, 15.01.2009), а другой со временем в формате с 12-часовым временем и «для AM и« р »для ...

python pandas datetime

вопрос задан: 15 January 2019 19:13

2

ответа

Добавить одну строку в панды DataFrame

Я понимаю, что pandas предназначен для загрузки полностью заполненного DataFrame, но мне нужно создать пустой DataFrame, а затем добавить строки, одну за другой. Каков наилучший способ сделать это? Я успешно создал ...

append pandas python dataframe

вопрос задан: 3 January 2019 15:25

2

ответа

Запуск простого анализа в очень большом текстовом файле - Python [duplicate]

У меня есть файл .txt объемом 6,6 ГБ (43 миллиона строк). Внутри файла находится около 20 столбцов данных. У меня те же данные, хранящиеся в таблице БД, и я хочу сделать простые сравнения выборочных проверок, например, количество строк, ...

python pandas

вопрос задан: 13 July 2018 18:55

2

ответа

pandas конвертирует серии в DataFrame без & ddpeo; dtype & rdquo; Информация

У меня есть серию под названием Sizemode со следующей структурой: В [1]: Sizemode Out [1]: 0 50000 1 248000 dtype: int64, и пока я пытаюсь создать из него файл данных ...

pandas dataframe series

вопрос задан: 13 July 2018 18:53

2

ответа

Как составить список для каждой строки значений двух столбцов данных

У меня есть два столбца, и я хотел бы создать список для каждой строки. Таким образом, каждый список будет содержать два значения; значения каждого столбца для этой конкретной строки. Например: A B 1 2 3 4 5 6 Я бы ...

python list pandas dataframe multiple-columns

вопрос задан: 13 July 2018 17:51

2

ответа

Как повернуть рамку данных pandas, чтобы включить средневзвешенное значение?

У меня есть некоторые данные в кадре данных pandas, где столбец даты - это индекс, следующий: значение даты A значение B категория страны ddmmyy A1 B1 US ...

python pandas

вопрос задан: 13 July 2018 17:42

2

ответа

Pandas frame complex self join

если у меня есть следующий идентификатор кадра | значение A | 50 B | 20 C | 10 A; B | C; B | A; B; C | Каков самый умный способ заполнить недостающие 70, 30, 80? Я попытался пропустить фрейм данных ...

python-3.x pandas

вопрос задан: 13 July 2018 15:48

2

ответа

Pandas: группировать строки фильтров, получать среднее значение

В python у меня есть кадр данных pandas df, например: ID Geo Speed 123 False 40 123 True 90 123 True 80 123 False 50 123 True 10 456 False ...

python pandas filter group-by mean

вопрос задан: 13 July 2018 13:43

2

ответа

Pandas создает идеальные данные панели, добавляя пустые строки на основе условий

Я ищу способ добавления пустых строк в dataframe, если выполняются два условия. Условия заключаются в том, что если идентификатор индекса не найден в конкретном году, код добавит пустую строку, которая имеет ...

python pandas panel-data

вопрос задан: 13 July 2018 10:42

2

ответа

Количество нулей среди нескольких столбцов

У меня есть pandas DataFrame, который имеет 10 столбцов, которые содержат либо 0, 1, либо NaN. Вот пример кадра данных, который напоминает то, что у меня есть. id col_1 col_2 col_3 'jk3' 1 1 NaN 'kp2' 1 ...

python pandas numpy dataframe

вопрос задан: 13 July 2018 08:13

2

ответа

Сохранить массив как значение в столбце Pandas

У меня есть набор данных с двумя столбцами данных категориальной метки (имена команд NBA). Я хочу использовать одну горячую кодировку для генерации двоичного, 1D-вектора в виде массива, представляющего каждую команду. Вот мой ...

python arrays pandas numpy dataframe

вопрос задан: 13 July 2018 07:19