У меня большой массив данных, который выглядит как: df1 ['A']. Ix [1: 3] 2017-01-01 02:00:00 [33, 34, 39] 2017-01-01 03:00:00 [ 3, 43, 9] Я хочу заменить каждый элемент больше 9 на 11. Итак, ...
У меня есть такой фрейм данных, который импортирован из CSV. сток pop Дата 2016-01-04 325.316 82 2016-01-11 320.036 83 2016-01-18 299.169 79 2016-01-25 296.579 84 2016-02 -...
Я смотрю, как сделать две вещи в Seaborn, используя гистограмму для отображения значений, которые находятся в кадре данных, но не на графике. 1) Я ищу, чтобы отобразить значения одного поля в ...
Я получаю сообщение об ошибке: ValueError: Неверное количество пропущенных элементов 3, размещение подразумевает 1, и я пытаюсь выяснить, где и как я могу приступить к решению проблемы. Я не очень ...
Как я могу получить номер строки в кадре данных, который содержит определенное значение в определенном столбце, используя Pandas? Например, у меня есть следующий фрейм данных: ClientID LastName 0 34 ...
Я взял набор данных KDD track1 из Kaggle и решил загрузить CSV-файл ~2,5 ГБ с 3 -столбцами в память на моем 16 ГБ -memory EC2 instance :data = np.loadtxt ('rec _log _train.txt' )python...
Мне часто нужно применить функцию к группам очень большого DataFrame (смешанных типов данных )и я хотел бы использовать преимущества нескольких ядер. Я могу создать итератор из групп и использовать...
Данные взяты из Бюро переписей США. Округа являются политическим и географическим подразделением штатов в Соединенных Штатах. Этот набор данных содержит данные о населении округов и штатов США ...
У меня есть мультииндексированный фрейм данных с именами, прикрепленными к уровням столбцов. Я хотел бы иметь возможность легко перетасовывать столбцы, чтобы они соответствовали порядку, указанному пользователем. Поскольку это ...
Когда я пытаюсь использовать строку _для вывода столбца из фрейма данных, он усекает вывод столбца. print gtf _df.ix[ :1][['транскрипт _id','атрибуты']].to _string (header=False,index=False )Out :'...
У меня есть большой Pandas DataFrame DatetimeIndex :3425100 записей, 2011 -12 -01 00 :00 :00 до 2011 -12 -31 23 :59 :59 Столбцы данных :sig _qual 3425100 non -null...
В самом общем смысле проблема, которую я хочу решить, состоит в преобразовании одного компонента многоуровневого индекса -в столбцы. То есть у меня есть серия, содержащая многоуровневый индекс, и я хочу, чтобы...
Я только начал использовать pandas/matplotlib в качестве замены Excel для создания гистограмм с накоплением. Я столкнулся с проблемой (1 )в цветовой палитре по умолчанию всего 5 цветов, поэтому, если у меня их больше...
У меня есть DataFrame со смесью 0 и других чисел. Я хотел бы преобразовать 0 в отсутствующие. Например, я ищу команду, которая конвертировала бы в [618] :a=DataFrame (data=[[1,2],[...
Я пытаюсь обернуть свой мозг вокруг структур данных панд и немного пытаюсь использовать их в гневе. Я понял, что групповые операции приводят к объекту серии pandas. Но никак не могу понять...
Я работаю с данными опроса, загруженными из файла h5 -как hdf = pandas.HDFStore ('Survey.h5' )через пакет pandas. В этом DataFrame все строки являются результатами одного опроса, тогда как...
У меня есть объект данных pandas, который выглядит так :один два три четыре пять 0 1 2 3 4 5 1 1 1 1 1 1 Я хочу создать список объектов списков, где...
У меня есть Pandas DataFrame с четырьмя столбцами: A, B, C, D. Оказывается, иногда значения B и C могут быть равны 0. Поэтому я хочу получить следующее :B[i] = B [i] if B[i] else min (A[i], D[...
У меня есть два больших (фрагмента, предоставленных )pandas DateFrames с неравными датами в качестве индексов, которые я хочу объединить в один :NAB.AX CBA.AX Close...
Как мне использовать scikit -для обучения модели на больших данных csv (~75 МБ )без проблем с памятью? Я использую блокнот IPython в качестве среды программирования и пакеты pandas+sklearn для...
Я извлекаю некоторые веб-данные, анализирую их и сохраняю вывод в виде Pandas DataFrame в файл HDF5. Прямо перед записью DataFrame в файл H5 я добавляю свою собственную строку описания в...
Я знаю, что pandas поддерживает вторичную ось Y, но мне любопытно, знает ли кто-нибудь способ разместить третичную ось Y на графиках... в настоящее время я добиваюсь этого с помощью numpy + pyplot... но это медленно с большими данными...
У меня проблемы с соединениями в пандах, и я пытаюсь понять, что не так. Скажем, у меня есть кадр данных x : DatetimeIndex :1941 записей, 2004 -10 -19...
Я изучаю возможность перехода на python и pandas в качестве давнего -пользователя SAS. Однако, проводя некоторые тесты сегодня, я был удивлен, что у python закончилась память при попытке выполнить pandas.read _csv ()a 128mb...
Кажется, я не могу найти элегантный способ индексации pandas.DataFrame по целочисленному индексу. В следующем примере я хочу получить значение «а» из первого элемента столбца «А». импортировать панд дф =...
У меня есть фрейм данных размером 200 000 x 500, загруженный в Pandas. Есть ли функция, которая может автоматически сообщать мне, в каких столбцах отсутствуют данные? Или мне нужно перебирать каждый столбец и проверять элемент по...
У меня простой вопрос, связанный с CSV-файлами и анализом даты и времени. У меня есть CSV-файл, который выглядит так :ГГГГММДД, ЧЧ, Х 20110101, 1, 10 20110101, 2, 20 20110101, 3, 30 Хотелось бы...
Я извлекаю массовые данные из устаревшей серверной системы, используя C/C++, и перемещаю их в Python с помощью distutils. После получения данных в Python я поместил их в объект pandas DataFrame для анализа данных....
Я пытаюсь создать серию фиктивных переменных из категориальной переменной, используя pandas в python. Я наткнулся на функцию get _манекенов, но всякий раз, когда я пытаюсь вызвать ее, я получаю сообщение об ошибке, которое...