Как добавить лишние слова / символы ко всем столбцам фреймворка в Python 3.6 У меня есть кадр данных с 15 + столбцами & amp; Я хочу добавить слово «Код» в список всех столбцов, существующих в dataframe. & ...
У меня есть следующий код для преобразования в datetime. Каждая строка содержит данные формата: 1/1/2012 2:21:00 PM result = pd.to_datetime (df ['sampledata']) # ошибка OutOfBoundsDatetime: Вне границ. ,
Я нашел это сообщение: одновременно добавляю несколько кадров данных pandas, я понимаю, как это работает: import numpy as np import pandas as pd dates = np.asarray (pd.date_range ('1/1/2000', периоды = 8)) df1 = pd ....
Я просто хочу знать, как конкатрировать несколько фреймов данных при условии, что столбцы одинаковы, но индексы могут быть дублирующими. Пример: df1 = pd.read_csv ("some_data1.csv") df2 = pd.read_csv ("...
Я не могу объединить две строки вместе, которые находятся в образце данных. Вот пример таблицы: Чтобы уточнить: я не работаю с двумя кадрами данных, показанными на картинке. Я только работаю с ...
У меня есть DataFrame с 8000 столбцов и 37605 строк, я хочу объединить те же имена столбцов и суммировать значения, но, как вы можете видеть, столбцы имеют субиндекс (я не знаю имя), разница ...
Я занимаюсь машинным обучением, и в настоящее время я использую следующий набор данных. https://archive.ics.uci.edu/ml/datasets/Occupancy+Detection+ Я хотел бы построить график зависимости температуры от ...
У меня есть фрейм данных pandas, называемый df, со следующими столбцами: (C / A, UNIT, SCP, DATEn, TIMEn, DESCn, ENTRIESn, EXITSn) И мне нужно добавить новый столбец ENTRIESn_hourly и назначить столбцу ...
Я использую приведенный ниже сценарий для чтения данных с MSSQL Server в Pyspark dataframes. DFFSA = spark.read.format ("jdbc"). Option ("url", jdbcURLDev) .option ("driver", MSSQLDriver) .option ("dbtable", "FSA.dbo ....
Прежде чем начать, я просто пытаюсь найти способ интерпретировать мои данные для летних исследований. На данный момент, когда я запускаю это, я получаю «ValueError: невозможно преобразовать строку в float: b'area» «Мой файл ...
def m_array_pre (x = 0, y = 0): market_array_pre = [] #market вернуть массив для окна предварительного события для i в before_event_window: market_array_pre.append (market_return_table.cell (1, y + i) .value) ...
Какой тип объектов я могу использовать для создания серии Pandas? При чтении документации, видимо, любой объект, подобный массиву, может использоваться как вход. Я бы подумал, что numpy ndarray object является массивом ...
У меня есть dataframe pandas: df = pd.DataFrame ({'Name': ['John', 'John', 'Mark', 'Mark'], 'Surname': ['Jones', 'Jones', 'James ',' Перес ']}) df Имя Фамилия 0 John Jones 1 ...
Я хочу подстроить фрейм данных в соответствии со значениями столбца в. Dataframe = pd.DataFrame (столбцы = ["timestamp", "id", "col1", "col2", "col3"], data = [[1 , "a", 1, 2, 3], ...
Работая с Pandas, и я хочу генерировать фиктивные переменные на месте в кадре данных, с которым я работаю, но он всегда генерирует два столбца для двоичных значений. Как я могу удержать его от разделения на ...
У меня есть задача, когда я хочу подготовить ввод для алгоритма кластеризации того же размера. Ввод содержит повторяющиеся строки для более важных наблюдений и важности важности ...
Я пытаюсь построить данные из двух разных фреймов рядом друг с другом, чтобы сравнить их, оба файла данных имеют одинаковые имена столбцов, но разные данные. Я бы хотел, чтобы каждый байт данных ...
У меня есть файловый фрейм PySpark mydf, и я группируюсь по 2 столбцам (код и col1), чтобы получить результирующую таблицу с наивысшим разным числом третьего столбца (newid). Например: mydf code col1 newid 100 ...
У меня есть кадр данных pandas со случайными числами, где индекс имеет тип dtype = 'datetime64 [ns]. В конце вопроса вы найдете воспроизводимый код. Когда я рисую это с помощью ax.dfplot (), я получаю ...
У меня есть кадр данных с столбцом, содержащим значения 1, 2 или 3. Я пытаюсь создать гистограмму, показывающую подсчет этих значений. Ось метки оси x показывает 1, 1,5, 2, 2,5 ...
У меня есть dataframe с 9 столбцами и 89K строк. Мне нужно выполнить TF-IDF с 2 строковыми столбцами. emp-name text Однако конечный результат состоит только из чисел из Tf-idf ...
Для любого, у кого есть опыт работы с Python и Pandas, я пытаюсь сравнить два файла данных (не равные индексы) и посмотреть, находится ли одно значение из столбца (studentID) в другом фрейме данных с помощью ...
У меня есть DataFrame A0 со столбцами: Описание, Сумма, Категория. Я хочу работать с данными, в которых сумма отрицательна, но вносить изменения в исходный DataFrame A0. Мои замены ...
У меня есть фрейм данных с именем Merged, который выглядит следующим образом: Позиция Эффект Размер 3 0.541160 5 0.080264 5 0.067536 5 0.050464 5 0.000581 7 0.129583 7 ...
Ниже приведен один из столбцов в dataframe df. Мне нужно вычесть 4 часа из каждого значения и создать новый столбец. Объект dtype sale_date является объектом. sale_date 15.08.2012 23:40 15.08.2012 23:45 15.08.2012 23: ...
Я использую набор данных в 60 000 экземпляров. Это занимает 6,4 секунды, чтобы прочитать файл xlsx, а затем преобразовать его в CSV. Как сократить время? Мой код: import pandas as pd import time def read_xlsx (path) ...