0
ответов

Панды: добавить столбец, если не существует

Я новичок в использовании панд и пишу сценарий, в котором я читаю данные в кадре, а затем выполняю некоторые вычисления для некоторых столбцов. Иногда у меня будет столбец с именем «Met»: df = pd.read_csv (File, ...
вопрос задан: 17 September 2014 17:08
0
ответов

python pandas объединяет информационный фрейм в список

У меня есть df вроде так: import pandas a = [['1/2/2014', 'a', '6', 'z1'], ['1/2/2014', 'a', '3' , 'z1'], ['1/3/2014', 'c', '1', 'x3'],] df = pandas.DataFrame.from_records (a [1:], columns = a [0]) Я ...
вопрос задан: 22 August 2014 06:03
0
ответов

Как отобразить полную (не усеченную) информацию о фрейме данных в html при конвертации из фрейма данных pandas в html?

Я преобразовал pandas dataframe в вывод html, используя функцию DataFrame.to_html. Когда я сохраняю это в отдельный HTML-файл, файл показывает усеченный вывод. Например, в моем столбце ТЕКСТ, df ....
вопрос задан: 17 August 2014 18:06
0
ответов

Панды: час возврата из столбца даты и времени напрямую

Предположим, у меня есть продажи DataFrame значений меток времени: timestamp sales_office 2014-01-01 09:01:00 Цинциннати 2014-01-01 09:11:00 Сан-Франциско 2014-01-01 15:22:00 Чикаго 2014- .. ,
вопрос задан: 4 August 2014 23:38
0
ответов

Панды: Бар-участок с двумя столбиками и двумя осями Y

У меня есть датафрейм, который выглядит примерно так: сумма цена возраст A 40929 4066443 B 93904 9611272 C 188349 19360005 D 248438 24335536 E 205622 18888604 F 140173 12580900 G ...
вопрос задан: 12 June 2014 11:22
0
ответов

Как обновить значения в определенной строке в DataFrame Python Pandas?

С хорошими методами индексации в Pandas у меня нет проблем с извлечением данных различными способами. С другой стороны, я все еще не понимаю, как изменить данные в существующем DataFrame. В следующих ...
вопрос задан: 4 June 2014 12:02
0
ответов

Фильтрация всех строк с помощью NaT в столбце в Python Dataframe

У меня есть df, как это: abc 1 NaT w 2 2014-02-01 g I NaT x df = df [df.b == '2014-02-01'] даст мне abc 2 2014-02-01 g I хочу ...
вопрос задан: 19 May 2014 21:26
0
ответов

Как сделать условное объединение в Python Pandas?

Я пытаюсь вычислить агрегации на основе времени в Pandas на основе значений даты, хранящихся в отдельных таблицах. Верх первой таблицы table_a выглядит следующим образом: COMPANY_ID DATE ...
вопрос задан: 7 May 2014 04:08
0
ответов

Джулия Дейфреймы против Питона Панды

В настоящее время я использую python-панд и хочу узнать, есть ли способ вывести данные из панд в julia Dataframes и наоборот. (Я думаю, что вы можете позвонить Python от Джулии с Pycall, но я ...
вопрос задан: 30 April 2014 02:19
0
ответов

В pandas / python чтение массива хранится в виде строки

У меня есть пандас dataframe, где один из столбцов имеет массив строк в качестве каждого элемента. Ну как то так. col1 col2 0 120 ['abc', 'def'] 1 130 ['ghi', 'klm'] Теперь, когда я сохраняю это в ...
вопрос задан: 16 April 2014 09:26
0
ответов

Хранить ограниченные записи только в Пандах

В Pandas я могу использовать df.dropna () для удаления любых записей NaN. Есть ли что-нибудь подобное в Pandas для удаления неконечных (например, Inf) записей?
вопрос задан: 2 April 2014 11:05
0
ответов

Создайте легенду с пандами и matplotlib.pyplot

Это моя первая попытка прорисовки с помощью Python, и у меня возникают проблемы при создании легенды. Это мой импорт: импорт matplotlib.pyplot как plt импорт панд Я загружаю свои данные следующим образом: data = ...
вопрос задан: 27 February 2014 13:56
0
ответов

Легенда показывает только одну метку при печати с пандами

У меня есть два кадра данных Pandas, которые я надеюсь построить на одной фигуре. Я использую ноутбук IPython. Я бы хотел, чтобы легенда показывала метку для обоих DataFrames, но пока я смог ...
вопрос задан: 24 February 2014 12:44
0
ответов

Рассчитать среднее значение, используя панд Python

Я хотел бы сгенерировать серию, которая является инкрементным средним временем серии Это означает, что, начиная с первой даты (индекс 0), среднее значение, хранящееся в строке x, является средним значением значений [0: x] индекса данных ...
вопрос задан: 15 January 2014 19:37
0
ответов

PYODBC to Pandas - DataFrame не работает - форма передаваемых значений (x, y), индексы подразумевают (w, z)

Раньше я использовал pyodbc с python, но теперь я установил его на новую машину (win 8 64 bit, Python 2.7 64 bit, PythonXY с Spyder). До того как я привык (внизу вы можете найти более реальный ...
вопрос задан: 18 November 2013 20:48
0
ответов

Pandas DataFrames со сравнением равенства NaNs

В контексте модульного тестирования некоторых функций я пытаюсь установить равенство 2-х DataFrames с помощью python pandas: ipdb> Ожидаем 1 2 2012-01-01 00: 00: 00 + 00: 00 ...
вопрос задан: 14 October 2013 08:22
0
ответов

pandas plot датафрейм барплот с цветами по категориям

Я хотел бы использовать панды для построения диаграммы с различными цветами для категории в столбце. Вот простой пример: (индекс является переменной) df: переменная группы значений a ...
вопрос задан: 19 September 2013 14:19
0
ответов

Панды - возможно объединить два столбца, используя два разных объединения?

Я загружаю CSV-файл, который имеет следующие столбцы: дата, textA, textB, numberA, numberB Я хочу сгруппировать по столбцам: date, textA и textB - но хочу применить «сумму» к числу A, но «мин "чтобы ...
вопрос задан: 16 September 2013 21:44
0
ответов

групповой мультииндексный панд данных

Можно ли сгруппировать мульти-индексный (2 уровня) фрейм данных панд по одному из мультииндексных уровней? Единственный способ сделать это - сбросить_индекс по мультииндексу, а затем снова установить индекс. Я ...
вопрос задан: 8 September 2013 22:57
0
ответов

Как мне вставить столбец с определенным индексом столбца в пандах?

Могу ли я вставить столбец с определенным индексом столбца в пандах? импортировать панд как pd df = pd.DataFrame ({'l': ['a', 'b', 'c', 'd'], 'v': [1,2,1,2]}) df [ 'n'] = 0 Это будет столбец n в качестве последнего столбца df, ...
вопрос задан: 7 September 2013 13:59
0
ответов

Исключение всех данных за данный процентиль

У меня есть pandas DataFrame с именем data и столбцом с именем ms. Я хочу исключить все строки, где data.ms выше 95% процентиля. Сейчас я делаю это: limit = data.ms.describe (90) ['95%' ...
вопрос задан: 2 September 2013 20:54
0
ответов

Как получить доступ к pandas groupby dataframe по ключу

Как получить доступ к соответствующему фрейму данных groupby в объекте groupby по ключу? Со следующим groupby: rand = np.random.RandomState (1) df = pd.DataFrame ({'A': ['foo', 'bar'] * 3, ...
вопрос задан: 1 September 2013 09:36
0
ответов

Функция агрегирования Pandas DataFrame с использованием нескольких столбцов

Есть ли способ написать функцию агрегирования, используемую в методе DataFrame.agg, которая будет иметь доступ к более чем одному столбцу агрегируемых данных? Типичными вариантами использования были бы...
вопрос задан: 13 August 2013 09:05
0
ответов

Как получить столбец по номеру в Пандах?

В чем разница между: Maand ['P_Sanyo_Gesloten'] Out [119]: время 2012-08-01 00:00:11 0 2012-08-01 00:05:10 0 2012-08-01 00:10:11 0 2012-08-01 00:20:10 0 2012-08-01 00:25:10 0 ...
вопрос задан: 19 June 2013 14:29
0
ответов

HDF5 занимает больше места, чем CSV?

Рассмотрим следующий пример: Подготовьте данные: импортируйте строку импортируйте случайный импорт панд в виде pd matrix = np.random.random ((100, 3000)) my_cols = [random.choice (string.ascii_uppercase) для x in ...
вопрос задан: 19 May 2013 23:18
0
ответов

Многоиндексная сортировка в пандах

У меня есть набор данных с многоиндексными столбцами в pandas df, которые я хотел бы отсортировать по значениям в определенном столбце. Я пытался использовать sortindex и sortlevel, но не смог получить результаты, которые я ...
вопрос задан: 13 May 2013 22:28
0
ответов

многоколоночный факторизация в пандах

Функция факторизации pandas присваивает каждому уникальному значению в серии последовательный индекс на основе 0 и вычисляет, к какому индексу принадлежит каждая запись в серии. Я хотел бы сделать эквивалент ...
вопрос задан: 9 May 2013 03:08
0
ответов

Применить функцию к группе панд

У меня есть pandas dataframe со столбцом my_labels, который содержит строки: «A», «B», «C», «D», «E» Я хотел бы посчитать количество вхождений каждой из этих строк, а затем разделить число ...
вопрос задан: 13 March 2013 00:01
0
ответов

Как рассчитать прокатный накопительный продукт на Pandas DataFrame

У меня есть временной ряд возвратов, бета-версия и альфа-версия в панде DataFrame. Как рассчитать скользящую годовую альфа для столбца альфа в DataFrame? (Я хочу сделать ...
вопрос задан: 8 March 2013 03:38
0
ответов

Подсчет ключа для каждого уникального значения в пандах

У меня есть набор данных, из которого я хочу построить количество ключей для каждого уникального идентификатора (x = unique_id_count, y = key_count), и я пытаюсь научиться использовать преимущества панд. В этом случае: ...
вопрос задан: 28 February 2013 03:00