0
ответов

Замена значений больше, чем число в кадре данных панд

У меня большой массив данных, который выглядит как: df1 ['A']. Ix [1: 3] 2017-01-01 02:00:00 [33, 34, 39] 2017-01-01 03:00:00 [ 3, 43, 9] Я хочу заменить каждый элемент больше 9 на 11. Итак, ...
вопрос задан: 3 May 2017 11:05
0
ответов

Скользящее среднее значение для панд по конкретному столбцу

У меня есть такой фрейм данных, который импортирован из CSV. сток pop Дата 2016-01-04 325.316 82 2016-01-11 320.036 83 2016-01-18 299.169 79 2016-01-25 296.579 84 2016-02 -...
вопрос задан: 16 April 2017 13:15
0
ответов

Seaborn Barplot - отображение ценностей

Я смотрю, как сделать две вещи в Seaborn, используя гистограмму для отображения значений, которые находятся в кадре данных, но не на графике. 1) Я ищу, чтобы отобразить значения одного поля в ...
вопрос задан: 4 April 2017 22:24
0
ответов

ValueError: Неверное количество пропущенных элементов - значение и предложения?

Я получаю сообщение об ошибке: ValueError: Неверное количество пропущенных элементов 3, размещение подразумевает 1, и я пытаюсь выяснить, где и как я могу приступить к решению проблемы. Я не очень ...
вопрос задан: 4 April 2017 13:50
0
ответов

Как получить номер строки в dataframe в Pandas?

Как я могу получить номер строки в кадре данных, который содержит определенное значение в определенном столбце, используя Pandas? Например, у меня есть следующий фрейм данных: ClientID LastName 0 34 ...
вопрос задан: 3 April 2017 20:42
0
ответов

серьезные проблемы с памятью при чтении CSV-файла с использованием numpy

Я взял набор данных KDD track1 из Kaggle и решил загрузить CSV-файл ~2,5 ГБ с 3 -столбцами в память на моем 16 ГБ -memory EC2 instance :data = np.loadtxt ('rec _log _train.txt' )python...
вопрос задан: 2 March 2017 18:00
0
ответов

Эффективное параллельное применение функции к сгруппированному кадру данных pandas

Мне часто нужно применить функцию к группам очень большого DataFrame (смешанных типов данных )и я хотел бы использовать преимущества нескольких ядер. Я могу создать итератор из групп и использовать...
вопрос задан: 29 January 2017 22:32
0
ответов

Операции функции панд

Данные взяты из Бюро переписей США. Округа являются политическим и географическим подразделением штатов в Соединенных Штатах. Этот набор данных содержит данные о населении округов и штатов США ...
вопрос задан: 9 January 2017 14:30
0
ответов

Как изменить порядок столбцов мультииндексированных фреймов данных на определенном уровне

У меня есть мультииндексированный фрейм данных с именами, прикрепленными к уровням столбцов. Я хотел бы иметь возможность легко перетасовывать столбцы, чтобы они соответствовали порядку, указанному пользователем. Поскольку это ...
вопрос задан: 6 January 2017 22:19
0
ответов

pandas DataFrame.to _строка ()усечение строк из столбцов

Когда я пытаюсь использовать строку _для вывода столбца из фрейма данных, он усекает вывод столбца. print gtf _df.ix[ :1][['транскрипт _id','атрибуты']].to _string (header=False,index=False )Out :'...
вопрос задан: 5 January 2017 00:38
0
ответов

Выбор подмножества Pandas DataFrame, индексированного DatetimeIndex, со списком меток времени

У меня есть большой Pandas DataFrame DatetimeIndex :3425100 записей, 2011 -12 -01 00 :00 :00 до 2011 -12 -31 23 :59 :59 Столбцы данных :sig _qual 3425100 non -null...
вопрос задан: 5 January 2017 00:35
0
ответов

Многоуровневый индекс для столбцов :получение значения _считается столбцами в пандах

В самом общем смысле проблема, которую я хочу решить, состоит в преобразовании одного компонента многоуровневого индекса -в столбцы. То есть у меня есть серия, содержащая многоуровневый индекс, и я хочу, чтобы...
вопрос задан: 5 January 2017 00:33
0
ответов

Как придать гистограмме pandas/matplotlib пользовательские цвета

Я только начал использовать pandas/matplotlib в качестве замены Excel для создания гистограмм с накоплением. Я столкнулся с проблемой (1 )в цветовой палитре по умолчанию всего 5 цветов, поэтому, если у меня их больше...
вопрос задан: 5 January 2017 00:25
0
ответов

кадр данных pandas -изменяет значения на основе заголовка столбца

У меня есть кадр данных, который выглядит следующим образом :In [74] :data2 Out[74] :a b c 2012 -06 -12 0 1 1 2012 -06 -13 1 1 0 2012 -06 -14 1 0 1 2012 -06 -15 1 0 1 2012 -06 -16 1 1 0...
вопрос задан: 5 January 2017 00:25
0
ответов

Преобразование данных в отсутствующие в пандах

У меня есть DataFrame со смесью 0 и других чисел. Я хотел бы преобразовать 0 в отсутствующие. Например, я ищу команду, которая конвертировала бы в [618] :a=DataFrame (data=[[1,2],[...
вопрос задан: 5 January 2017 00:24
0
ответов

Присоединение серии Pandas с иерархическим индексом обратно к исходному кадру данных

Я пытаюсь обернуть свой мозг вокруг структур данных панд и немного пытаюсь использовать их в гневе. Я понял, что групповые операции приводят к объекту серии pandas. Но никак не могу понять...
вопрос задан: 5 January 2017 00:20
0
ответов

Разрезать Pandas DataFrame по строкам

Я работаю с данными опроса, загруженными из файла h5 -как hdf = pandas.HDFStore ('Survey.h5' )через пакет pandas. В этом DataFrame все строки являются результатами одного опроса, тогда как...
вопрос задан: 5 January 2017 00:19
0
ответов

Как создать список из кадра данных pandas с именем столбца и значениями столбца?

У меня есть объект данных pandas, который выглядит так :один два три четыре пять 0 1 2 3 4 5 1 1 1 1 1 1 Я хочу создать список объектов списков, где...
вопрос задан: 5 January 2017 00:14
0
ответов

Pandas DataFrame Применить

У меня есть Pandas DataFrame с четырьмя столбцами: A, B, C, D. Оказывается, иногда значения B и C могут быть равны 0. Поэтому я хочу получить следующее :B[i] = B [i] if B[i] else min (A[i], D[...
вопрос задан: 5 January 2017 00:14
0
ответов

concat pandas DataFrame по индексам временных рядов

У меня есть два больших (фрагмента, предоставленных )pandas DateFrames с неравными датами в качестве индексов, которые я хочу объединить в один :NAB.AX CBA.AX Close...
вопрос задан: 5 January 2017 00:11
0
ответов

Scikit и Pandas :Подгонка больших данных

Как мне использовать scikit -для обучения модели на больших данных csv (~75 МБ )без проблем с памятью? Я использую блокнот IPython в качестве среды программирования и пакеты pandas+sklearn для...
вопрос задан: 5 January 2017 00:10
0
ответов

Добавление моего собственного атрибута описания в Pandas DataFrame

Я извлекаю некоторые веб-данные, анализирую их и сохраняю вывод в виде Pandas DataFrame в файл HDF5. Прямо перед записью DataFrame в файл H5 я добавляю свою собственную строку описания в...
вопрос задан: 5 January 2017 00:08
0
ответов

PANDAS отображает несколько осей Y

Я знаю, что pandas поддерживает вторичную ось Y, но мне любопытно, знает ли кто-нибудь способ разместить третичную ось Y на графиках... в настоящее время я добиваюсь этого с помощью numpy + pyplot... но это медленно с большими данными...
вопрос задан: 5 January 2017 00:06
0
ответов

Панды объединяют/объединяют/объединяют два фрейма данных

У меня проблемы с соединениями в пандах, и я пытаюсь понять, что не так. Скажем, у меня есть кадр данных x : DatetimeIndex :1941 записей, 2004 -10 -19...
вопрос задан: 5 January 2017 00:05
0
ответов

Большой постоянный DataFrame в pandas

Я изучаю возможность перехода на python и pandas в качестве давнего -пользователя SAS. Однако, проводя некоторые тесты сегодня, я был удивлен, что у python закончилась память при попытке выполнить pandas.read _csv ()a 128mb...
вопрос задан: 5 January 2017 00:05
0
ответов

Индексирование фрейма данных pandas по целому числу

Кажется, я не могу найти элегантный способ индексации pandas.DataFrame по целочисленному индексу. В следующем примере я хочу получить значение «а» из первого элемента столбца «А». импортировать панд дф =...
вопрос задан: 5 January 2017 00:04
0
ответов

обработка отсутствующих данных в Pandas

У меня есть фрейм данных размером 200 000 x 500, загруженный в Pandas. Есть ли функция, которая может автоматически сообщать мне, в каких столбцах отсутствуют данные? Или мне нужно перебирать каждый столбец и проверять элемент по...
вопрос задан: 5 January 2017 00:04
0
ответов

Разбирайте даты, когда ГГГГММДД и ЧЧ находятся в отдельных столбцах, используя pandas в Python

У меня простой вопрос, связанный с CSV-файлами и анализом даты и времени. У меня есть CSV-файл, который выглядит так :ГГГГММДД, ЧЧ, Х 20110101, 1, 10 20110101, 2, 20 20110101, 3, 30 Хотелось бы...
вопрос задан: 5 January 2017 00:03
0
ответов

Существует ли C/C++ API для python pandas? [закрыто]

Я извлекаю массовые данные из устаревшей серверной системы, используя C/C++, и перемещаю их в Python с помощью distutils. После получения данных в Python я поместил их в объект pandas DataFrame для анализа данных....
вопрос задан: 5 January 2017 00:02
0
ответов

Создание фиктивных переменных в pandas для python

Я пытаюсь создать серию фиктивных переменных из категориальной переменной, используя pandas в python. Я наткнулся на функцию get _манекенов, но всякий раз, когда я пытаюсь вызвать ее, я получаю сообщение об ошибке, которое...
вопрос задан: 5 January 2017 00:02