0
ответов

установить мульти-индекс существующего фрейма данных в пандах

У меня есть DataFrame, который выглядит как Emp1 Empl2 дата Компания 0 0 0 2012-05-01 apple 1 0 1 2012-05-29 apple 2 0 1 2013-05 -...
вопрос задан: 15 December 2016 14:35
0
ответов

Как отобразить панды DataFrame с плавающей запятой, используя строку формата для столбцов?

Я хотел бы отобразить кадр данных pandas с заданным форматом, используя print () и IPython display (). Например: df = pd.DataFrame ([123.4567, 234.5678, 345.6789, 456.7890], ...
вопрос задан: 9 December 2016 20:06
0
ответов

Группировка ежедневных данных по месяцам в python / pandas, а затем нормализация

У меня есть таблица ниже в Pandas DataFrame: q_string q_visits q_date 0 ядро ​​1790 2012-10-02 00:00:00 1 нейрон 364 2012-10-02 00:00:00 2 текущий ...
вопрос задан: 1 December 2016 06:22
0
ответов

Python PANDAS конвертировать индекс в дату и время

Как мне преобразовать индекс строк панды в формат даты и времени? Мой фрейм данных 'df' похож на это значение 2015-09-25 00:46 71.925000 2015-09-25 00:47 71.625000 2015-09 -...
вопрос задан: 26 November 2016 05:22
0
ответов

Python - разбиение фрейма данных на несколько фреймов на основе значений столбцов и присвоение им имен с этими значениями [дубликаты]

У меня есть большой набор данных, в котором перечислены товары конкурентов, которые продаются в разных регионах страны. Я хочу разделить этот фрейм данных на несколько других на основе региона с помощью итеративного ...
вопрос задан: 9 November 2016 10:24
0
ответов

Создать DataFrame из нескольких серий

У меня есть 2 серии: pd.Series () для i в диапазоне (0, 10): s = s.set_value (i, i * 5) s ....
вопрос задан: 9 October 2016 07:58
0
ответов

Панды заменяют символы во всех именах столбцов

У меня есть фреймы данных с именами столбцов (из файлов .csv), содержащие (и), и я хотел бы заменить их на _. Как я могу сделать это на месте для всех столбцов?
вопрос задан: 28 September 2016 08:00
0
ответов

Панды: найти процентиль статистику данного столбца

У меня есть фрейм данных pandas my_df, где я могу найти среднее (), медиану (), mode () данного столбца: my_df ['field_A']. Mean () my_df ['field_A']. Median () my_df ['field_A']. mode () Мне интересно, это ...
вопрос задан: 19 September 2016 20:50
0
ответов

Панды: групповые и совокупные без потери столбца, который был сгруппирован

У меня есть датафрейм панд, как показано ниже. Для каждого идентификатора у меня может быть несколько Имен и Подидов. Id NAME SUB_ID 276956 A 5933 276956 B 5934 276956 C 5935 287266 D 1589 Я хочу ...
вопрос задан: 12 September 2016 09:03
0
ответов

dplyr суммировать эквивалент в пандах

Я имел обыкновение работать с R и очень люблю пакет dplyr, который вы можете легко группировать и обобщать. Однако в пандах я не вижу эквивалента суммирования, и вот как я этого добиваюсь в Python: ...
вопрос задан: 13 August 2016 18:56
0
ответов

Удаление строки DataFrame в Pandas на основе значения столбца

У меня есть следующий DataFrame: daysago line_race rating rw wating line_date 2007-03-31 62 11 56 1 ....
вопрос задан: 29 July 2016 21:00
0
ответов

Панды объединяют два кадра данных с разными столбцами

Я, конечно, упускаю что-то простое здесь. Попытка объединить два кадра данных в пандах, которые в основном имеют одинаковые имена столбцов, но в правом кадре есть некоторые столбцы, которых нет в левом, и наоборот ...
вопрос задан: 28 July 2016 05:08
0
ответов

эквивалент панды np.where

np.where имеет семантику векторизованного if / else (аналогично методу Apache Spark, когда / иначе DataFrame). Я знаю, что я могу использовать np.where в серии Pandas, но Pandas часто определяет свой собственный API для ...
вопрос задан: 26 July 2016 00:59
0
ответов

Как сохранить отсутствующие даты (интервал 15 минут) из csv в новый файл (интервал 15 минут) -python 3.5

Я новичок в python, поэтому некоторые идеи по продвижению вперед будут высоко оценены. Проблема: у меня есть 44 местоположения с производственными данными в день (интервал 15 минут) за месяцы с декабря по июнь. Общие данные ...
вопрос задан: 21 July 2016 10:10
0
ответов

Удаление панд с помощью df.drop не работает

У меня есть такой DataFrame (первый столбец - индекс (786 ...), а второй день (25 ...) и количество осадков пусто: количество осадков за день (миллиметры) 786 25 787 ...
вопрос задан: 20 July 2016 13:28
0
ответов

Случайная выборка подмножества кадра данных в Pandas

Скажем, у меня есть фрейм данных с 100 000 записей и я хочу разделить его на 100 секций по 1000 записей. Как взять случайную выборку, скажем, размером 50 из одного из 100 разделов. набор данных ...
вопрос задан: 28 June 2016 20:17
0
ответов

Как печатать как вывод ячейки по умолчанию на ноутбуке Jupyter

Я столкнулся с проблемой при печати кадров данных панд в блокноте Jupyter. Если имена столбцов действительно длинные, это нарушает структуру данных в разных строках. Как я могу напечатать это так, как ...
вопрос задан: 21 June 2016 14:48
0
ответов

Ошибка «ValueError: метки ['timestamp'] не содержатся на оси»

У меня есть этот код, я хочу удалить столбец 'timestamp' из файла: u.data, но не могу. Он показывает ошибку "ValueError: метки ['timestamp'] не содержатся в оси" Как я могу исправить это импорт тупица ...
вопрос задан: 11 June 2016 16:48
0
ответов

Как фильтровать строки в пандах по регулярному выражению

Я хотел бы аккуратно отфильтровать фрейм данных с помощью регулярных выражений в одном из столбцов. Для надуманного примера: в [210]: foo = pd.DataFrame ({'a': [1,2,3,4], 'b': ['hi', 'foo', 'fat', 'cat ']}) В [211]: ...
вопрос задан: 9 April 2016 18:08
0
ответов

Панды: обратитесь к имени столбца, без учета регистра

Используя Pandas DataFrame, допустим, у меня есть несколько столбцов в CSV-файле, и я хочу иметь возможность получить доступ к любому из них через имя без учета регистра. импортировать панд как pd df = pd.read_csv (path_to_csv, ...
вопрос задан: 3 April 2016 18:37
0
ответов

Панды данных умножают на серию [дубликаты]

Каков наилучший способ умножить все столбцы Pandas DataFrame на вектор столбцов, хранящийся в Series? Я делал это в Matlab с помощью repmat (), которого нет в Pandas. Я могу использовать нп ....
вопрос задан: 29 March 2016 14:19
0
ответов

Ряд панд в JSON

У меня есть датафрейм в пандах, и моя цель - записать каждую строку фрейма в виде нового файла json. Я немного застрял прямо сейчас. Моя интуиция заключалась в том, чтобы перебирать строки в кадре данных (используя df ....
вопрос задан: 17 March 2016 03:26
0
ответов

Чтение файла из частного хранилища S3 в пандас

Я пытаюсь прочитать файл CSV из частного сегмента S3 в кадр данных pandas: df = pandas.read_csv ('s3: //mybucket/file.csv'). Я могу прочитать файл из открытого сегмента, но, читая файл из частного ...
вопрос задан: 4 March 2016 18:37
0
ответов

Pandas: проблемы с пониманием того, как работает слияние

Я делаю что-то не так со слиянием и не могу понять, что это такое. Я сделал следующее, чтобы оценить гистограмму ряда целочисленных значений: импортировать pandas как pnd import numpy as np series...
вопрос задан: 26 February 2016 09:25
0
ответов

Есть ли контекстный менеджер для временного изменения настроек matplotlib?

В pandas и seaborn можно временно изменить параметры отображения / печати с помощью ключевого слова with, которое применяет указанный параметр только к отступу кода, оставляя ...
вопрос задан: 15 February 2016 03:18
0
ответов

Matplotlib показывает перекрывающиеся ярлыки x-tick, несмотря на все усилия

Посмотрите на график ниже: это часть более крупного рисунка: я вижу две проблемы с ним. Во-первых, метки оси X накладываются друг на друга (это моя главная проблема). Во-вторых. местонахождение ...
вопрос задан: 27 January 2016 16:28
0
ответов

Разделите несколько столбцов на другой столбец в пандах

Мне нужно разделить все, кроме первых столбцов в DataFrame на первый столбец. Вот что я делаю, но мне интересно, если это не «правильный» способ панд: df = pd.DataFrame (np.random.rand (10,3), ...
вопрос задан: 31 December 2015 03:38
0
ответов

панды to_sql все столбцы как nvarchar

У меня есть pandas dataframe, который динамически создается с разными именами столбцов. Я пытаюсь отправить их в sql, но не хочу, чтобы они переходили на mssqlserver в качестве типа данных "текст" по умолчанию (может кто-нибудь ...
вопрос задан: 20 December 2015 16:14
0
ответов

Как я могу установить ось X в качестве даты и времени на графике боке?

Я использую боке с ноутбуком ipython. Я хочу построить линейный график в боке, используя панду DataFrame, содержащую datetime: импортировать панд как pd из datetime, импортировать datetime как dt из bokeh.io ...
вопрос задан: 23 November 2015 13:55
0
ответов

Панды применяются, но только для строк, где выполняется условие

Я хотел бы использовать Pandas df.apply, но только для определенных строк. В качестве примера я хочу сделать что-то подобное, но моя реальная проблема немного сложнее: import pandas as pd import math z = ...
вопрос задан: 18 November 2015 00:43