pandas - список вопросов по программированию pandas

2

ответа

Добавить суффикс в столбцы в pandas dataframe [duplicate]

Как добавить лишние слова / символы ко всем столбцам фреймворка в Python 3.6 У меня есть кадр данных с 15 + столбцами & amp; Я хочу добавить слово «Код» в список всех столбцов, существующих в dataframe. & ...

python pandas dataframe

вопрос задан: 19 May 2016 01:15

2

ответа

Python: OutOfBoundsDatetime: сохранение записей с правильным форматом даты и времени [дубликат]

У меня есть следующий код для преобразования в datetime. Каждая строка содержит данные формата: 1/1/2012 2:21:00 PM result = pd.to_datetime (df ['sampledata']) # ошибка OutOfBoundsDatetime: Вне границ. ,

python pandas datetime

вопрос задан: 18 April 2016 12:00

2

ответа

добавить несколько (+100) кадров данных pandas для создания данных (дубликат)

Я нашел это сообщение: одновременно добавляю несколько кадров данных pandas, я понимаю, как это работает: import numpy as np import pandas as pd dates = np.asarray (pd.date_range ('1/1/2000', периоды = 8)) df1 = pd ....

python pandas dataframe append

вопрос задан: 10 April 2016 05:42

2

ответа

Как я могу конкатрировать несколько фреймов данных, которые имеют одинаковые столбцы [duplicate]

Я просто хочу знать, как конкатрировать несколько фреймов данных при условии, что столбцы одинаковы, но индексы могут быть дублирующими. Пример: df1 = pd.read_csv ("some_data1.csv") df2 = pd.read_csv ("...

python pandas

вопрос задан: 10 April 2016 05:42

2

ответа

Как объединить 2 строки в кадре данных? [Дубликат]

Я не могу объединить две строки вместе, которые находятся в образце данных. Вот пример таблицы: Чтобы уточнить: я не работаю с двумя кадрами данных, показанными на картинке. Я только работаю с ...

python pandas dataframe

вопрос задан: 10 April 2016 05:42

2

ответа

Pandas: удалить заголовок столбца индекса [дубликат]

кто-нибудь знает, как удалить заголовок столбца индекса при применении pandas.read_csv и to_csv? Пример: импорт datetime import pandas как pd из io import BytesIO todays_date = datetime ....

pandas indexing

вопрос задан: 9 April 2016 15:47

2

ответа

Читайте из конкретных строк csv в pandas [duplicate]

Я использую pandas для чтения моего файла csv следующим образом. input_data = pd.read_csv (input_file, header = 0, delimiter = "\ t", quoting = 3) L = input_data ["components"] + '. '+ input_data ["recipe"] documents_list ...

pandas

вопрос задан: 25 March 2016 11:48

2

ответа

Как сумма столбцов с одинаковым именем [дублировать]

У меня есть DataFrame с 8000 столбцов и 37605 строк, я хочу объединить те же имена столбцов и суммировать значения, но, как вы можете видеть, столбцы имеют субиндекс (я не знаю имя), разница ...

python pandas merge sum

вопрос задан: 2 March 2016 13:09

2

ответа

Изменение частоты datetime xticks - matplotlib [duplicate]

Я занимаюсь машинным обучением, и в настоящее время я использую следующий набор данных. https://archive.ics.uci.edu/ml/datasets/Occupancy+Detection+ Я хотел бы построить график зависимости температуры от ...

python pandas matplotlib series

вопрос задан: 17 February 2016 20:02

2

ответа

Добавление столбца в рамку данных pandas [duplicate]

У меня есть фрейм данных pandas, называемый df, со следующими столбцами: (C / A, UNIT, SCP, DATEn, TIMEn, DESCn, ENTRIESn, EXITSn) И мне нужно добавить новый столбец ENTRIESn_hourly и назначить столбцу ...

python pandas

вопрос задан: 18 January 2016 02:56

2

ответа

Python Чтение из SQL в pandas dataframes [duplicate]

Я использую приведенный ниже сценарий для чтения данных с MSSQL Server в Pyspark dataframes. DFFSA = spark.read.format ("jdbc"). Option ("url", jdbcURLDev) .option ("driver", MSSQLDriver) .option ("dbtable", "FSA.dbo ....

python pandas pyspark spark-dataframe pyspark-sql

вопрос задан: 15 January 2016 19:34

2

ответа

Необходимо исключить заголовки из кода данных, пытается создать граф из [duplicate]

Прежде чем начать, я просто пытаюсь найти способ интерпретировать мои данные для летних исследований. На данный момент, когда я запускаю это, я получаю «ValueError: невозможно преобразовать строку в float: b'area» «Мой файл ...

python-2.7 pandas numpy matplotlib

вопрос задан: 28 November 2015 19:45

2

ответа

ValueError: данные Pandas передаются в numpy dtype объекта. Проверьте входные данные с помощью np.asarray (data) [duplicate]

def m_array_pre (x = 0, y = 0): market_array_pre = [] #market вернуть массив для окна предварительного события для i в before_event_window: market_array_pre.append (market_return_table.cell (1, y + i) .value) ...

python pandas numpy statsmodels

вопрос задан: 20 November 2015 20:42

2

ответа

Какой вклад я могу использовать для панд? [Дубликат]

Какой тип объектов я могу использовать для создания серии Pandas? При чтении документации, видимо, любой объект, подобный массиву, может использоваться как вход. Я бы подумал, что numpy ndarray object является массивом ...

pandas input

вопрос задан: 20 November 2015 15:38

2

ответа

Pandas duplicate rows [duplicate]

У меня есть dataframe pandas: df = pd.DataFrame ({'Name': ['John', 'John', 'Mark', 'Mark'], 'Surname': ['Jones', 'Jones', 'James ',' Перес ']}) df Имя Фамилия 0 John Jones 1 ...

python pandas

вопрос задан: 21 September 2015 16:56

2

ответа

Подзадайте фрейм данных в соответствии со значениями столбца [duplicate]

Я хочу подстроить фрейм данных в соответствии со значениями столбца в. Dataframe = pd.DataFrame (столбцы = ["timestamp", "id", "col1", "col2", "col3"], data = [[1 , "a", 1, 2, 3], ...

python pandas dataframe matplotlib

вопрос задан: 28 August 2015 07:24

2

ответа

Pandas.get_dummies () кодировка одного столбца [дубликат]

Работая с Pandas, и я хочу генерировать фиктивные переменные на месте в кадре данных, с которым я работаю, но он всегда генерирует два столбца для двоичных значений. Как я могу удержать его от разделения на ...

python pandas

вопрос задан: 8 August 2015 01:58

2

ответа

Заменить столбец рядами pandas [duplicate]

Как изменить фигуру (используя pandas): 0 1 \ trans -0.521058 -0.521058 serie -0.521816 -0.521816 recor -0.468133 -0.468133 to: trans serie recor ...

python python-2.7 pandas scikit-learn sklearn-pandas

вопрос задан: 27 July 2015 16:15

2

ответа

Дублировать строки в dataframe на основе значения столбца [duplicate]

У меня есть задача, когда я хочу подготовить ввод для алгоритма кластеризации того же размера. Ввод содержит повторяющиеся строки для более важных наблюдений и важности важности ...

python pandas dataframe lambda

вопрос задан: 17 July 2015 22:06

2

ответа

Силовой барплот с данными из двух разных кадров данных [дубликат]

Я пытаюсь построить данные из двух разных фреймов рядом друг с другом, чтобы сравнить их, оба файла данных имеют одинаковые имена столбцов, но разные данные. Я бы хотел, чтобы каждый байт данных ...

python pandas matplotlib seaborn

вопрос задан: 7 July 2015 15:25

2

ответа

PySpark группируется по 2 столбцам, чтобы получить первое число за группу [duplicate]

У меня есть файловый фрейм PySpark mydf, и я группируюсь по 2 столбцам (код и col1), чтобы получить результирующую таблицу с наивысшим разным числом третьего столбца (newid). Например: mydf code col1 newid 100 ...

python pandas pyspark pyspark-sql

вопрос задан: 26 June 2015 03:08

2

ответа

Подмножество данных на основе значений в другом фрейме данных [дубликат]

У меня есть dataframe df1: df1 = pd.DataFrame ({'id': [1, 2, 3, 4, 5], 'date': [4, 5, 6, 7, 8], 'str': [ 'a', 'b', 'c', 'd', 'e']}) Я хочу извлечь ...

python pandas dataframe

вопрос задан: 1 June 2015 20:11

2

ответа

Гистограмма: Как я могу получить тот же формат даты на оси x, что и в диаграмме временных рядов? [Дубликат]

У меня есть кадр данных pandas со случайными числами, где индекс имеет тип dtype = 'datetime64 [ns]. В конце вопроса вы найдете воспроизводимый код. Когда я рисую это с помощью ax.dfplot (), я получаю ...

python pandas matplotlib

вопрос задан: 8 May 2015 21:50

2

ответа

Python - plt.xticks - Как подавить текст выше Гистограмма? [Дубликат]

У меня есть кадр данных с столбцом, содержащим значения 1, 2 или 3. Я пытаюсь создать гистограмму, показывающую подсчет этих значений. Ось метки оси x показывает 1, 1,5, 2, 2,5 ...

python pandas matplotlib

вопрос задан: 23 April 2015 17:33

2

ответа

Как слить результат из & ldquo; Group-By & rdquo; с оригинальным фреймворком данных в Pandas [дубликат]

У меня есть dataframe с 9 столбцами и 89K строк. Мне нужно выполнить TF-IDF с 2 строковыми столбцами. emp-name text Однако конечный результат состоит только из чисел из Tf-idf ...

python pandas dataframe tf-idf

вопрос задан: 15 April 2015 04:13

2

ответа

Pandon Pandas Проверьте, является ли значение в Dataframe [дубликат]

Для любого, у кого есть опыт работы с Python и Pandas, я пытаюсь сравнить два файла данных (не равные индексы) и посмотреть, находится ли одно значение из столбца (studentID) в другом фрейме данных с помощью ...

python pandas dataframe

вопрос задан: 6 April 2015 20:39

2

ответа

Как установить значения в исходный Pandas DataFrame с несколькими срезами? [Дубликат]

У меня есть DataFrame A0 со столбцами: Описание, Сумма, Категория. Я хочу работать с данными, в которых сумма отрицательна, но вносить изменения в исходный DataFrame A0. Мои замены ...

python pandas

вопрос задан: 5 April 2015 19:13

2

ответа

Поиск среднего значения среди одинаковых значений в DataFrame [duplicate]

У меня есть фрейм данных с именем Merged, который выглядит следующим образом: Позиция Эффект Размер 3 0.541160 5 0.080264 5 0.067536 5 0.050464 5 0.000581 7 0.129583 7 ...

pandas dataframe group-by average mean

вопрос задан: 30 March 2015 12:12

2

ответа

Вычитание часов с даты в кадре данных pandas [duplicate]

Ниже приведен один из столбцов в dataframe df. Мне нужно вычесть 4 часа из каждого значения и создать новый столбец. Объект dtype sale_date является объектом. sale_date 15.08.2012 23:40 15.08.2012 23:45 15.08.2012 23: ...

python pandas datetime

вопрос задан: 10 March 2015 18:20

2

ответа

Как сократить время на чтение xlsx и преобразовать его в csv в pandas на большом наборе данных? [Дубликат]

Я использую набор данных в 60 000 экземпляров. Это занимает 6,4 секунды, чтобы прочитать файл xlsx, а затем преобразовать его в CSV. Как сократить время? Мой код: import pandas as pd import time def read_xlsx (path) ...

python pandas

вопрос задан: 27 February 2015 15:20