pandas - список вопросов по программированию pandas

1

ответ

Кадр данных от длинного к широкому с использованием двух столбцов в качестве переменных

Я хочу изменить следующие данные от длинного к широкому, используя и port1, и port2 в качестве переменных интереса

вопрос задан: 19 March 2019 08:00

1

ответ

Слияние двух столбцов с неуникальными строками и NaNs в пандах

У меня есть два столбца в кадре данных df: A B 0 NaN NaN 1 3,14 NaN 2 NaN 4,20 3 3,65 0,68 Ожидаемый результат для df: A B C 0 NaN NaN NaN 1 3,14 NaN 3,14 2 NaN 4,20 4,20 3 3,65 ...

python pandas dataframe join merge

вопрос задан: 19 March 2019 03:44

1

ответ

Выберите записи в серии панд на основе одной части мультииндекса

У меня есть серия Pandas, построенная так, как этот импорт импорта itertools pandas как pd combos = list (itertools.permutations (['BB', 'BW', 'WW'], 2)) combo_values = pd.Series ([2,4, 0,2,0,0], комбо) Итак ...

python python-3.x pandas

вопрос задан: 19 March 2019 00:23

1

ответ

Конвертер XML в CSV

Я пытался преобразовать xml-файлы в csv-файл. У меня была эта ошибка python xml_to_csv.py Traceback (последний вызов был последним): файл "xml_to_csv.py", строка 3, в < module > импортировать панд как pd ...

python pandas numpy anaconda

вопрос задан: 18 March 2019 18:53

1

ответ

Самый эффективный способ сортировки массива по бинам, указанным индексным массивом?

Задача на примере: data = np.array ([1, 2, 3, 4, 5, 6, 7, 8, 9]) idx = np.array ([2, 0, 1, 1, 2, 0, 1, 1, 2]) Ожидаемый результат: binned = np.array ([2, 6, 3, 4, 7, 8, 1, 5, 9]) Ограничения: Должны ...

python pandas numpy scipy pythran

вопрос задан: 18 March 2019 18:48

1

ответ

рассчитать расстояние от данных широты и долготы из панелей данных

Я новичок в пандах. У меня есть DataFrame, который имеет идентификатор места и его широту и долготу в виде столбцов. Мне нужно создать отдельный Dataframe, который находит расстояние между каждым местом. Есть ...

python-3.x pandas latitude-longitude

вопрос задан: 18 March 2019 18:37

1

ответ

Создать таблицу Excel для каждого уникального значения в столбце DataFrame Python

У меня ОЧЕНЬ большой CSV-файл с 250 000+ записями, который требует времени для выполнения любого анализа в Excel, поэтому я хотел разделить его на несколько листов на основе определенного вычисляемого столбца, который я ...

python excel pandas

вопрос задан: 18 March 2019 18:36

1

ответ

Нормализовать многомерный массив

У меня есть массив 5x600x16, пример меньшего аналогичного массива показан ниже. Мне нужно нормализовать значения по столбцам в каждом срезе (из 5 всего). тензор ([[[9.9771e-01, 6.6219e-02, 8 ....

python pandas numpy

вопрос задан: 18 March 2019 18:25

1

ответ

Построить двухосный график с использованием DataFrame

У меня есть DataFrame, который выглядит так: состояние сегментов времени выполнения пикселей 0 Техас 0.079277 1756374 12960 1 Калифорния 0.045553 1221211 5129 ...

python pandas matplotlib graph

вопрос задан: 18 March 2019 18:10

1

ответ

Общий виртуал, некоторые библиотеки видны, некоторые нет

У меня есть программа на Python, которая используется многими нетехническими пользователями. Он доступен всем на Dropbox. Самый простой способ доставить его всем - это также поделиться виртуозностью в Dropbox. Каждый'...

python pandas macos numpy virtualenv

вопрос задан: 18 March 2019 18:07

1

ответ

Удаление выпадающих значений создает пустые значения в панде

У меня есть ненулевой dataframe df, который имеет около 100 столбцов. Я хочу удалить выбросы из каждого столбца, для чего я делаю следующее. df1 = df [np.abs (df - df.mean ()) < = (3 * df.std ())] Я бы ...

python pandas dataframe

вопрос задан: 18 March 2019 17:49

1

ответ

Как сохранить порядок при сохранении dict как фрейма данных панд?

Если у меня есть примеры данных: dic = {'common': {'value': 18, 'attr': 20, 'param': 22}, 'fuzzy': {'value': 14, 'attr': 21, 'param': 24}, 'adhead': {'value': 13, 'attr': 20, 'param': 29} ...

python pandas

вопрос задан: 18 March 2019 17:48

1

ответ

Новый файл Pandas показывает индексы из старых панд

Я создал новый файл панд из старого файла панд, основываясь на некоторых условиях. Проблема в том, что индексы в новом файле панд не от 0 до размера, индексы просто взяты из старых панд. Что я ...

python pandas

вопрос задан: 18 March 2019 16:55

1

ответ

Как сгенерировать имена петлевых CSV-файлов с помощью Pandas?

Мне нужно выводить файлы CSV в цикле. Использование панд для i в диапазоне (1, int (len (feed_file_order) / 2000) +2): print (i) final_frame = final_frame.append (feed_file_order [u: (2000 * i)]) u = u + 2000 .. ,

python pandas loops csv

вопрос задан: 18 March 2019 16:35

1

ответ

Как повернуть сгруппированный объект с помощью панд [дубликат]

У меня есть таблица ниже: + ----------- + ------ + ------- + | member_id | год | считать | + ----------- + ------ + ------- + | 1 | 2012 | 1 | | 1 | 2013 | 0 | | 1 | 2014 | 1 | | ...

python pandas

вопрос задан: 18 March 2019 16:03

1

ответ

init () принимает от 1 до 6 позиционных аргументов, но было дано 11

Пожалуйста, помогите Noob, чтобы решить проблему. у меня есть 2 списка, заполненных переменными str: краткий список кластеров: = кластеры 'Кук зер', 'Подсол', 'Пшен оз', 'Сах св', 'Соя', 'Ячм оз', 'Ячм яр'] = ['Восток ',' Восток_2 ',' Курск ', ...

python pandas dataset

вопрос задан: 18 March 2019 15:27

1

ответ

Нахождение среднего из трех последовательных строк в пандах и групповых

У меня есть набор данных GPS (в формате CSV) сотен людей, и я должен изучить мобильность их. Мне удалось вычислить расстояние между каждой из двух точек, а затем вычислить скорость по ...

python pandas dataframe

вопрос задан: 18 March 2019 12:49

1

ответ

Pandas - возвращает последний / первый день месяца в пользовательском указателе даты и времени

Я использую мульти-индексный столбец данных с пользовательскими датами (определенные праздники, будни ...). DatetimeIndex (['1989-01-31', '1989-02-01', '1989-02-02', '1989-02-03', '1989-02-06', '1989-02-07' ...

python pandas dataframe

вопрос задан: 18 March 2019 01:56

1

ответ

Pandas - агрегирование значения столбца из другого кадра данных на основе общего столбца между двумя кадрами данных

У меня есть 2 разных кадра данных, например, и мне нужно добавить столбец «Present In» к первому кадру данных, в котором перечислены все элементы в C, которые соответствуют K ID во втором кадре данных. Итак ...

python-3.x pandas dataframe

вопрос задан: 18 March 2019 00:19

1

ответ

Замените некоторые значения в кадре данных на NaN, если индекс строки не существует в другом кадре данных

У меня действительно большой массив данных, похожий на этот: CustomerId Latitude Longitude 0. a x1 y1 1. a x2 y2 2. b x3 y3 3. ...

python pandas dataframe

вопрос задан: 17 March 2019 23:49

1

ответ

Импорт файла CSV в Python в массив NumPy

Я пытаюсь импортировать некоторые значения из CSV-файла в массив NumPy в Python. До сих пор я читал CSV-файл с пандами, но мне не удалось создать пустой массив со значениями из CSV ...

python pandas csv numpy

вопрос задан: 17 March 2019 23:33

1

ответ

Как вычесть строку строки в Pandas

Мне нравится вычитать строку из другой строки в той же строке. в приведенном ниже примере мне нравится удалять oroville из "oroville 1974 honda st 90 очень чистым", а затем создавать новую колонку с ...

python string pandas

вопрос задан: 17 March 2019 22:17

1

ответ

Решение набора данных Titanic (Kaggle) с использованием RFC, неизвестный тип метки: 'unknown'

Я решаю проблему с набором данных Titanic Kaggle, используя RFC, и получаю сообщение об ошибке «Неизвестный тип метки:« неизвестный »» при подгонке данных к модели. Я чувствую, что ошибка в у, но я не мог найти ...

python pandas kaggle

вопрос задан: 17 March 2019 21:29

1

ответ

Применить функцию к столбцу списков данных

У меня есть набор текстовых строк (A). Я могу разбить их на жетоны (B). Я хотел бы отбросить некоторые из токенов, чтобы в итоге я получил только слова (C). Я пытался: из nltk.tokenize импортировать word_tokenize ...

pandas natural-language-processing

вопрос задан: 17 March 2019 11:03

1

ответ

Как преобразовать список значений в серии в панды данных [дубликаты]

У меня есть ряд, как показано ниже, 0 [1, 12, 23] 1 [2, 23, 54] 2 [3, 23] 3 [4] dtype: объект Я хочу преобразовать этот отдельный ряд в фрейм данных на основе значений в списке (взорваться) ...

python pandas

вопрос задан: 13 March 2019 11:38

1

ответ

Python, эквивалентный соединению неравенства в SQL [duplicate]

Недавно я начал использовать Python на работе вместо SQL. У меня нет доступа к каким-либо серверам, и ИТ-отдел не позволит мне установить локальный экземпляр SQL SERVER EXPRESS. Наборы данных слишком велики для использования ...

python sql pandas tsql

вопрос задан: 11 March 2019 21:02

1

ответ

Экспорт вложенного JSON в CSV с использованием Python

У меня есть следующий скрипт JSON, который я получил от Xero. Это вложенный сценарий JSON, и я пытаюсь создать плоскую таблицу, а затем экспортировать ее в CSV. Я написал этот код Python, но я изо всех сил ...

python json pandas nested

вопрос задан: 11 March 2019 15:49

1

ответ

Странное поведение пользовательской функции с агрегатом панд

Давайте предположим, что эти данные: df = pd.DataFrame ({'user_id': [1, 1, 2, 2, 1, 3, 1], 'purchase_id': [3, 2, 3, 1, 1, 2, 3 ], 'purchase_amount': [10, 0.50, 10, 1, ...

python pandas

вопрос задан: 11 March 2019 14:51

1

ответ

Как я могу ранжировать ячейку в столбце в Пандах каждые 5 строк? [Дубликат]

Например: df = pd.DataFrame ({'a': [10, 8, 4, 3, 5, 1, 21, 14, 19, 20, 7, 6, 0, 4, 3, 11]}) a 0 10 1 8 2 4 3 3 4 5 5 1 6 21 7 14 8 19 9 20 10 7 11 6 12 0 13 ...

pandas

вопрос задан: 11 March 2019 14:19

1

ответ

Суммирование столбцов фреймов данных из разных фреймов данных

У меня есть несколько временных файлов .csv, которые я читаю в кадре данных (df). Я хотел бы создать еще один фрейм данных, в который будет добавлена сумма всех этих фреймов. Примеры ...

python pandas

вопрос задан: 11 March 2019 13:57