0
ответов

pandas, matplotlib, используйте индекс кадра данных в качестве меток осей

Я использую функцию imshow ()matplotlib, чтобы показать pandas.DataFrame. Я бы хотел, чтобы метки и отметки для осей x и y рисовались из списков DataFrame.index и DataFrame.columns, но я...
вопрос задан: 5 January 2017 00:02
0
ответов

NumPy или Pandas :Сохранение типа массива как целого числа при наличии значения NaN

Есть ли предпочтительный способ сохранить фиксированный тип данных массива numpy как int (или int64 или что-то еще ), но при этом иметь элемент внутри, указанный как numpy.NaN? В частности, я конвертирую в -...
вопрос задан: 5 January 2017 00:00
0
ответов

проблема преобразования python pandas DataFrame в R dataframe для использования с rpy2

У меня возникли проблемы с преобразованием pandas DataFrame в Python в объект R для будущего использования в R с использованием rpy2. Новый выпуск панд 0.8.0 (, выпущенный несколько недель назад ), имеет функцию преобразования панд...
вопрос задан: 4 January 2017 23:58
0
ответов

Разница в статистических моделях Python OLS и lm R

Я не уверен, почему я получаю несколько разные результаты для простого OLS, в зависимости от того, прохожу ли я через экспериментальный интерфейс rpy от panda, чтобы выполнить регрессию в R, или использую статистические модели в...
вопрос задан: 4 January 2017 23:58
0
ответов

Как использовать метод среднего значения для временных рядов pandas со значениями типа Decimal?

Мне нужно хранить значения десятичного типа Python в объекте pandas TimeSeries/DataFrame. Pandas выдает мне ошибку при использовании «groupby» и «mean» в TimeSeries/DataFrame. Следующий код основан на...
вопрос задан: 4 January 2017 23:57
0
ответов

Эффективно создавать Pandas DataFrame из большого списка кортежей/строк

Я унаследовал файл данных, сохраненный в формате Stata.dta. Я могу загрузить его с помощью функции scikits.statsmodels genfromdta (). Это помещает мои данные в 1 -размерный массив NumPy, где каждая запись представляет собой...
вопрос задан: 4 January 2017 23:54
0
ответов

Каковы преимущества нового синтаксиса хэшей в Ruby 1.9?

Помимо более лаконичного определения хэшей с символами в качестве ключей, есть ли другие преимущества записи хеша в виде :{key1 :"value1", key2 :"value2"} вместо { :ключ1 => "значение1"...
вопрос задан: 4 January 2017 23:54
0
ответов

Как сгруппировать записи pandas DataFrame по дате в уникальном столбце -

Pandas DataFrame содержит столбец с именем «дата», который содержит не -уникальные значения даты и времени. Я могу сгруппировать строки в этом кадре, используя :data.groupby (data['date'] )Однако это разбивает данные по...
вопрос задан: 4 January 2017 23:47
0
ответов

Эффективный коинтеграционный тест в Python

Мне интересно, есть ли лучший способ проверить, объединены ли две переменные, чем следующий метод :import numpy as np импортировать statsmodels.api как sm импортировать statsmodels.tsa.stattools как ts y =...
вопрос задан: 4 January 2017 23:47
0
ответов

нарезка кадра данных pandas по диапазону дат

Я использую pandas для анализа финансовых отчетов. У меня есть DataFrame, полученный из CSV-файла, который выглядит так : DatetimeIndex :800 записей, 2010 -10 -27...
вопрос задан: 4 January 2017 23:46
0
ответов

Гистограмма Pandas с определенными цветами и расположением легенды?

У меня есть pandas DataFrame, и я хочу построить гистограмму с легендой. импортировать pylab как pl из pandas import *x = DataFrame ({"Альфа" :Серия ({1 :1, 2 :3, 3 :2.5} ), "Бета" :Ряд ({1 :2, 2 :...
вопрос задан: 4 January 2017 23:45
0
ответов

Могу ли я экспортировать кадр данных Python Pandas в MS SQL?

Я использую pymssql и пакет Pandas sql для загрузки данных из SQL в кадр данных Pandas с запросом кадра _. Я хотел бы отправить его обратно в базу данных SQL, используя кадр записи _, но я не был...
вопрос задан: 4 January 2017 23:41
0
ответов

Pandas предупреждение о повторных записях в индексе

В документации Pandas по методу поворота у нас есть: Примеры -------- >>> df foo bar baz 0 один А 1. 1 один Б 2. 2 один С 3. 3 два А 4. 4 два В 5. 5 ...
вопрос задан: 4 January 2017 23:31
0
ответов

pandas MovingOLS не поддерживает значения NA?

Я использую функцию pandas.ols из версии 0.7.3. Меня интересует движущаяся регрессия, например :model = pandas.ols (y = реализованные данные, x = pastData, intercept = 0, window _type="rolling",...
вопрос задан: 4 January 2017 23:30
0
ответов

Добавление двух фреймов данных pandas

У меня есть два фрейма данных, оба проиндексированы временными рядами. Мне нужно добавить элементы вместе, чтобы сформировать новый фрейм данных, но только если индекс и столбец одинаковы. Если элемент не существует в одном из ...
вопрос задан: 4 January 2017 23:24
0
ответов

Поворот DataFrame в Pandas для вывода в CSV

Это простой вопрос, ответ на который на удивление сложно найти в Интернете. Вот ситуация: >>> А [('эй', 'ты', 4), ('эй', 'не ты', 5), ('не эй', 'ты', 2), ('не эй',...
вопрос задан: 4 January 2017 23:24
0
ответов

Как записать/прочитать кадр данных Pandas с MultiIndex из/в файл ASCII?

Я хочу иметь возможность создать Pandas DataFrame с MultiIndexes для индекса строк и столбцов и прочитать его из текстового файла ASCII. Мои данные выглядят так: :col _indx = MultiIndex.from _tuples ([('A',...
вопрос задан: 4 January 2017 23:21
0
ответов

Pandas DataFrame Добавить столбец в индекс без сброса

Как мне добавить 'D' в индекс ниже без необходимости его сброса в первую очередь? из pandas import DataFrame df = DataFrame ({'a': range (6), 'b': range (6), 'c': range (6)}) df.set_index (['a', 'b'] , на месте = True) ...
вопрос задан: 4 January 2017 23:21
0
ответов

Как я могу обобщить свою группировку данных pandas более чем на 3 измерения?

Я использую отличный пакет pandas для обработки большого количества разнообразных метеорологических диагностических данных, и мне быстро не хватает размеров, когда я сшиваю данные вместе. Глядя на ...
вопрос задан: 4 January 2017 23:20
0
ответов

Создание Excel-подобного SUMIFS в пандах

Недавно я узнал о пандах и был рад видеть его аналитическую функциональность.Я пытаюсь преобразовать функции массива Excel в Pandas, эквивалентные автоматизации электронных таблиц, которые я создал ...
вопрос задан: 4 January 2017 23:19
0
ответов

индексация кадра данных pandas

У меня есть Multindex DataFrame со следующей структурой :0 1 2 ref А Б 21 45 0,01 0,56 0,23 0,02 22 45 0,30 0,88 0,53 0,87 23 46 0,45 0,23 0,90 0,23...
вопрос задан: 4 January 2017 23:18
0
ответов

pandas: объединить два столбца в DataFrame

У меня есть pandas DataFrame, в котором есть несколько столбцов: индекс: 239897 записей, 11.05.2012, 15:20:00 до 02.06.2012, 23:44. :51 Столбцы данных: foo 11516 ненулевых значений bar ...
вопрос задан: 4 January 2017 23:17
0
ответов

XML в кадр данных pandas

У меня есть файл XML с тысячами строк, например: WORD Я хочу преобразовать его (все его атрибуты)...
вопрос задан: 4 January 2017 23:16
0
ответов

Pandas переиндексирует DataFrame с объектами даты и времени

Можно ли переиндексировать DataFrame pandas, используя столбец, состоящий из объектов datetime? У меня есть DataFrame df со следующими столбцами :Int64Index :19610 записей, от 0 до 19609 Столбцы данных :центр...
вопрос задан: 4 January 2017 23:16
0
ответов

Как преобразовать фрейм данных pandas, чтобы индекс был уникальным набором значений, а данные - количеством каждого значения?

У меня есть кадр данных из вопросов с несколькими вариантами ответов, и он отформатирован следующим образом: Sex Qu1 Qu2 Qu3 Имя Боб М 1 2 1 Джон М 3 3 5 Алекс М 4 1 2 Jen F 3 2 ...
вопрос задан: 4 January 2017 23:15
0
ответов

Получить pandas.read_csv для чтения пустых значений в виде пустой строки вместо nan

Я использую библиотеку pandas для чтения некоторых данных CSV. В моих данных некоторые столбцы содержат строки. Строка "нан" является возможным значением, как и пустая строка. Мне удалось заставить pandas читать "nan"...
вопрос задан: 4 January 2017 23:13
0
ответов

«Таблицы зебры» в блокноте IPython?

Я создаю несколько интерактивных рабочих процессов в IPython, используя фантастическую Notebook для интерактивного анализа и Pandas. Некоторые из таблиц, которые я показываю, было бы намного легче читать, если бы немного...
вопрос задан: 4 January 2017 23:08
0
ответов

Возврат нескольких значений из pandas apply в DataFrame

Я использую Pandas DataFrame для выполнения построчного t-теста, как в этом примере: import numpy import pandas df = pandas.DataFrame(numpy.log2(numpy.randn(1000, 4), columns=["a", "b", "...
вопрос задан: 4 January 2017 23:08
0
ответов

Условно заполнить значения столбцов на основе другого значения столбцов в пандах

У меня есть DataFrame с несколькими столбцами. Один столбец содержит символ, для которого используется валюта, например знак евро или доллар. Другой столбец содержит значение бюджета. Так, например, в ...
вопрос задан: 4 January 2017 23:05
0
ответов

Pandas: где здесь утечка памяти?

Я столкнулся с проблемой утечки памяти, используя библиотеку pandas в python. Я создаю объекты pandas.dataframe в своем классе, и у меня есть метод, который меняет размер фрейма данных в соответствии с моими условиями. После изменения ...
вопрос задан: 4 January 2017 23:02