2
ответа

в Pandas (Python), как добавить столбец с groupby, на который ссылаются два столбца

Я пытаюсь добавить столбец в Pandas GroupBy DataFrame. Новый столбец (E) представляет собой сумму значений в столбце (C) с тем же ключом (A, B). Этот ключ состоит из двух других столбцов кадра данных (A, B) ....
вопрос задан: 16 January 2019 21:13
2
ответа

Панды: Любые () Все () с if / else

Я пытаюсь сделать простое утверждение if / else на фрейме данных Pandas. Я получил ошибку. Значение истины серии неоднозначно. поэтому я попытался использовать any () all (). Использование этих параметров вызывает только ...
вопрос задан: 16 January 2019 20:14
2
ответа

Как преобразовать фрейм данных в & ldquo; ColumnName1 | Value1 \ r \ n ColumnName2 | Value2 \ r \ n ColumnName3 | Value3 & Rdquo; так далее

У меня есть пандас dataframe, состоящий из 11 столбцов и 1 строки. Мне нужен конечный вывод, чтобы перейти от: Введите ID С К XYZ 999 Тони Энди К: Тип | XYZ ID | 999 С | Тони К | Энди Результатом будет ...
вопрос задан: 16 January 2019 19:36
2
ответа

Столбцы GroupBy на префиксе заголовка столбца

У меня есть датафрейм с именами столбцов, которые начинаются с заданного списка префиксов. Я хочу получить сумму значений в кадре данных, сгруппированных по столбцам, которые начинаются с того же префикса. df = pd.DataFrame (...
вопрос задан: 16 January 2019 17:55
2
ответа

Выберите данные на основе нескольких критериев с помощью панд

Я новичок в использовании панд. Я хочу выбрать строки в кадре данных, где несколько столбцов совпадают по значению. Вдоль строк: если столбец A равен столбцу AB, а столбец B равен столбцу BC, тогда я хочу ...
вопрос задан: 16 January 2019 17:11
2
ответа

Панды: как суммировать наборы данных неравного размера?

Допустим, у меня есть наборы данных различного размера, например, X_1 = [1,2,3] и X_2 = [4,5,6,7,8]. Я хотел бы создать фрейм данных со сводными переменными (mean, std и т. Д.), С одним набором данных на строку и далее ...
вопрос задан: 16 January 2019 16:41
2
ответа

Панды не считают строки должным образом

Итак, у меня есть этот фрейм данных: имя файла ширина высота класс xmin ymin xmax ymax 0 128782.JPG 640 512 Panel 36 385 119 510 1 128782.JPG 640 512 Panel ...
вопрос задан: 16 January 2019 15:01
2
ответа

заменить последующий символ, если значения ряда содержат определенный набор символов в пандах

У меня есть такой фрейм данных: df: col1 col2 col3 1 123xy56 pyrxyz 3 hcv P xy12 R T 5 453xy Z 2 lxy6 Q I ...
вопрос задан: 16 January 2019 14:47
2
ответа

Применить функцию к кадру данных на основе столбца с другим кадром данных на основе индекса

Я хотел бы выполнить некоторую операцию (например, x * яблок ^ y) над значениями яблок столбца, основываясь на их цвете. Соответствующие значения находятся в отдельном фрейме данных: import pandas as pd import numpy ...
вопрос задан: 16 January 2019 14:45
2
ответа

Как удалить строки из фрейма данных Pandas, если такая же строка существует в другом фрейме данных, но в итоге все столбцы из обоих df

У меня есть два разных фрейма данных Pandas, которые имеют один общий столбец. Я видел похожие вопросы о переполнении стека, но ни один из них, по-видимому, не заканчивался столбцами из обоих фреймов, поэтому, пожалуйста ...
вопрос задан: 16 January 2019 14:22
2
ответа

Панды to_csv преобразует столбец str в int (или с плавающей точкой)

Как без названия, я заметил, что pandas 'to_csv' автоматически преобразует столбцы, в которых есть только буквенно-цифровые строки для плавания. Я создаю кадр данных в блокноте Jupyter и создаю столбец ...
вопрос задан: 16 January 2019 12:57
2
ответа

Как разбить столбец на несколько столбцов в пандах с определенной позицией разделителя?

вот мой фрейм данных df_test 0 (-, 136), (-, 136), 1,0 1 (-, 136), (-, 438), 0,5 2 (-, 136), (-, 257), 0,5 хотелось бы чтобы увидеть результат, как это df_t1 df_t2 ...
вопрос задан: 16 January 2019 11:37
2
ответа

Как получить второе по величине значение в Pandas Python [дубликат]

Это мой код: maxData = all_data.groupby (['Id']) [features] .agg ('max') all_data = pd.merge (all_data, maxData.reset_index (), суффиксы = ["", "_max" ], how = 'left', on = ['Id']) Теперь вместо получения ...
вопрос задан: 16 January 2019 10:38
2
ответа

Python - Как создать новые столбцы на основе расчетов одного столбца. Расчет флагов UserAccountControl

У меня есть следующий пример фрейма данных: column1, column2, column3 tom, 0100,544 tim, 0101,514 ben, 0899,1512 Третий столбец содержит useraccountcontrolflag, и каждая строка представляет одну запись пользователя ....
вопрос задан: 16 January 2019 09:30
2
ответа

Преобразуйте вложенный DataFrame с отсортированными уникальными значениями во вложенный словарь в Python

Я пытаюсь взять вложенный DataFrame и преобразовать его во вложенный словарь. Вот мой оригинальный DataFrame со следующими уникальными значениями: input: df.head (5) output: reviewerName ...
вопрос задан: 16 January 2019 08:45
2
ответа

Найти корреспондентов в фреймах данных для расчета

Два кадра данных, как показано ниже, и я хочу рассчитать коэффициент корреляции. Он отлично работает, когда оба столбца заполнены фактическими значениями. Но когда они не, это берет ноль как ценность, когда ...
вопрос задан: 16 January 2019 06:08
2
ответа

Мой фрейм данных возвращает 0 строк, но при использовании фильтров в электронной таблице Excel отображаются строки

Мой фрейм данных не возвращает строки в соответствии с фильтром даты, но когда я открываю один и тот же файл в электронной таблице Excel и использую фильтры, я могу получить данные. Что я делаю неправильно? Приложения для ...
вопрос задан: 16 January 2019 01:45
2
ответа

Как проверить, присутствует ли вложенный список, а если нет, вкладывать?

У меня есть одна строка df, которая выглядит следующим образом: теги id 1 [[[band_music, fun], tv], movies] Иногда в зависимости от источника df может выглядеть так: теги id 1 [[[...
вопрос задан: 16 January 2019 00:34
2
ответа

Получение имен столбцов и количества пустых значений из df.info () pandas

У меня есть пандас DataFrame с именем df: df = {'a': [1, NaN, 2, NaN]}, ... 'b': [1, 5, 6, 6]} Я хочу список кортежей, каждый кортеж, содержащий: (column_name, #_non_null ...
вопрос задан: 15 January 2019 22:09
2
ответа

Как объединить один столбец данных Pandas с датой, а другой - со временем?

Я работаю с CSV, у которого есть два столбца, один с датой в формате месяц / день / год (например, 15.01.2009), а другой со временем в формате с 12-часовым временем и «для AM и« р »для ...
вопрос задан: 15 January 2019 19:13
2
ответа

Добавить одну строку в панды DataFrame

Я понимаю, что pandas предназначен для загрузки полностью заполненного DataFrame, но мне нужно создать пустой DataFrame, а затем добавить строки, одну за другой. Каков наилучший способ сделать это? Я успешно создал ...
вопрос задан: 3 January 2019 15:25
2
ответа

Запуск простого анализа в очень большом текстовом файле - Python [duplicate]

У меня есть файл .txt объемом 6,6 ГБ (43 миллиона строк). Внутри файла находится около 20 столбцов данных. У меня те же данные, хранящиеся в таблице БД, и я хочу сделать простые сравнения выборочных проверок, например, количество строк, ...
вопрос задан: 13 July 2018 18:55
2
ответа

pandas конвертирует серии в DataFrame без & ddpeo; dtype & rdquo; Информация

У меня есть серию под названием Sizemode со следующей структурой: В [1]: Sizemode Out [1]: 0 50000 1 248000 dtype: int64, и пока я пытаюсь создать из него файл данных ...
вопрос задан: 13 July 2018 18:53
2
ответа

Как составить список для каждой строки значений двух столбцов данных

У меня есть два столбца, и я хотел бы создать список для каждой строки. Таким образом, каждый список будет содержать два значения; значения каждого столбца для этой конкретной строки. Например: A B 1 2 3 4 5 6 Я бы ...
вопрос задан: 13 July 2018 17:51
2
ответа

Как повернуть рамку данных pandas, чтобы включить средневзвешенное значение?

У меня есть некоторые данные в кадре данных pandas, где столбец даты - это индекс, следующий: значение даты A значение B категория страны ddmmyy A1 B1 US ...
вопрос задан: 13 July 2018 17:42
2
ответа

Pandas frame complex self join

если у меня есть следующий идентификатор кадра | значение A | 50 B | 20 C | 10 A; B | C; B | A; B; C | Каков самый умный способ заполнить недостающие 70, 30, 80? Я попытался пропустить фрейм данных ...
вопрос задан: 13 July 2018 15:48
2
ответа

Pandas: группировать строки фильтров, получать среднее значение

В python у меня есть кадр данных pandas df, например: ID Geo Speed ​​123 False 40 123 True 90 123 True 80 123 False 50 123 True 10 456 False ...
вопрос задан: 13 July 2018 13:43
2
ответа

Pandas создает идеальные данные панели, добавляя пустые строки на основе условий

Я ищу способ добавления пустых строк в dataframe, если выполняются два условия. Условия заключаются в том, что если идентификатор индекса не найден в конкретном году, код добавит пустую строку, которая имеет ...
вопрос задан: 13 July 2018 10:42
2
ответа

Количество нулей среди нескольких столбцов

У меня есть pandas DataFrame, который имеет 10 столбцов, которые содержат либо 0, 1, либо NaN. Вот пример кадра данных, который напоминает то, что у меня есть. id col_1 col_2 col_3 'jk3' 1 1 NaN 'kp2' 1 ...
вопрос задан: 13 July 2018 08:13
2
ответа

Сохранить массив как значение в столбце Pandas

У меня есть набор данных с двумя столбцами данных категориальной метки (имена команд NBA). Я хочу использовать одну горячую кодировку для генерации двоичного, 1D-вектора в виде массива, представляющего каждую команду. Вот мой ...
вопрос задан: 13 July 2018 07:19