В настоящее время я работаю над вариантом использования с использованием RandomForestRegressor. Чтобы получить данные обучения и тестирования отдельно на основе одного столбца, скажем, Home, кадр данных был разбит на словарь. Почти сделано с ...
У меня есть простое условие: если сумма за месяц // 100: вывести сумму и сбросить индекс cumsum else: продолжить cumsumming Вот мои данные: data = dict (Year = ['2018', '2018', '2018', '2018 ',' 2018 ',' ...
Мне нужно передать строку через запятую в API. в настоящее время df выглядит следующим образом: теги id 1 ['dc', 'independent_press', 'exclusive_variants', 'marvel'] Документация по API для тегов находится здесь ...
У меня есть df с полями год, месяц, день, отформатированные как целые числа. Я использовал следующее, чтобы извлечь день недели. Как я могу сделать это более питонически? ### Первая попытка - Успешно lst = [] ...
Я работаю над тем, чтобы сгруппировать свои данные по свойству Department, а затем сгруппировать их и заполнить пространство над и под двумя полями, которые заполняются в середине набора данных (Rating и ...
Я нашел функцию isin для панд, но похоже, что все заглавные буквы не отображаются? импортировать панд как pd df = pd.read_json ('{"Technology Group": {"0": "Cloud", "1": "Cloud", "2": "Cloud", "3": "Collaboration", "4":»...
У меня есть DataFrame со столбцами, похожими на: введите описание изображения здесь я хочу использовать 'pd.groupby', чтобы сгруппировать строки в соответствии со столбцом ID. Кроме того, я хочу использовать .agg () для применения функций ...
Мой набор данных выглядит следующим образом: Col1, Col2, Col3, AA, BB, DD, E, NA, FF, NA, GG. Я бы хотел объединить строки друг под другом, чтобы конечный продукт выглядел следующим образом.
Я читаю SQL-запрос и использую его как столбцы данных. query = "SELECT count (*) как numRecords, YEARWEEK (date) как weekNum FROM событий GROUP BY YEARWEEK (date)" df = pd.read_sql (query, ...
У меня есть текстовый файл с названием штатов и университетов. Я прочитал его в dataframe с помощью pandas.read_table (). Затем я перебираю его с помощью iterrows () и для каждого элемента, который я хотел бы ...
Я пытаюсь переместить некоторые данные во фрейм данных панд. Теперь у меня есть эти данные: Мое ожидаемое поведение: поэтому, когда col B = дата / время, col B-E сдвигаются на единицу.
Я пытаюсь добавить заголовки столбцов с пустыми значениями к моему фрейму данных (так же, как этот ответ), но в функции, которая уже модифицирует его, например: mydf = pd.DataFrame () def myfunc (df): df [' ...
Загрузка данных из пакета на машине с Windows, кодирование не выполняется. require (vegdata) tax_dbf < - load.taxlist ("GermanSL 1.3", подробный = TRUE) tax_dbf [33, "BEGRUEND"] [1] "" Einfügen einer ...
У меня есть два кадра данных df1 и df2. У df1 есть записи сумм, потраченных пользователями, и у каждого пользователя может быть несколько записей с разными значениями сумм. Второй кадр данных просто содержит информацию о ...
Как мне соединить два кадра данных pandas (df1, df2) на двух ключах (bla1, bla2), где ключ bla2 следует использовать, когда он не нулевой (см. Последние две строки в df1)? Псевдокод, если bla2 не нулевой ...
Я хочу взять финансовые данные с помощью API. Я так и делаю. #load jsons library ("rjson") json_file < - "https://api.coindesk.com/v1/bpi/currentprice/USD.json" json_data < - fromJSON (вставить (readLines (json_file), ...
Чтобы прочитать сжатый zip-файл csv-файла с пандами в моем локальном блокноте Jupyter, я выполняю: import pandas as pd pd.read_csv ('csv_file.zip'). Однако в Watson Studio read_csv () вызывает исключение, когда я ...
Я пытаюсь создать новый столбец в кадре данных, который назначает значения на основе значений в другом столбце. Код, который я использую, присваивает значения, но не так, как хотелось бы. Я не уверен, что мне не хватает. ...
У меня есть фрейм данных, который выглядит следующим образом: порог < - c ("thresh1", "thresh3", "thresh10", "thresh3", "thresh3", "thresh10") выражение < - c ("express") , "выраженный", "выраженный", "...
У меня есть список data.frames (в этом примере только 2): set.seed (1) df1 < - data.frame (id = sample (LETTERS, 50, replace = T), val = rnorm (50), val1 = rnorm (50), stringsAsFactors = F) df2 < - data ....
Я пытаюсь реализовать алгоритм Single Pass для следующей проблемы: для каждого индекса в кадре данных определите, какие столбцы содержат это значение, имена этих столбцов затем сохраняются в виде списка ...