1
ответ

Повторите каждую строку data.frame количество раз, указанное в столбце

df <-data.frame (var1 = c ('b', 'c'), var2 = c ('d', 'e', 'f'), частота = 1:3), Что самый простой путь состоит в том, чтобы развернуть каждую строку первые два столбца data.frame выше, так, чтобы...
вопрос задан: 5 November 2019 15:20
1
ответ

Как удалить строки Pandas DataFrame, значение которых в определенном столбце равно NaN

У меня есть этот DataFrame, и мне нужны только записи, столбец EPS которых не равен NaN: > > > df STK_ID EPS наличными STK_ID RPT_Date 601166 20111231 601166 NaN NaN ...
вопрос задан: 13 July 2019 01:04
1
ответ

Значение поиска панд в диапазоне от другой таблицы

В приведенном ниже примере я пытаюсь проверить, находится ли «Значение» в таблице 1 в диапазоне значений в строке в таблице 2 для столбцов «Старт» и «Стоп». Если значение находится в этом диапазоне, я хочу вернуть ...
вопрос задан: 27 June 2019 00:19
1
ответ

Как различить две строки разных цветов в Excel при чтении их в кадр данных панд?

У меня есть файл Excel, в котором первая строка содержит имена столбцов, а во 2-й строке, например, в 10-й строке, строки окрашены в оранжевый цвет, с 11-й по 25-ю строку они окрашены в желтый и с 26-го ...
вопрос задан: 25 June 2019 19:29
1
ответ

Запись DataFrame для панд в файл CSV

У меня есть данные в пандах, которые я хотел бы записать в файл CSV. Я делаю это с помощью: df.to_csv ('out.csv') и получаю сообщение об ошибке: UnicodeEncodeError: кодек «ascii» не может кодировать символ u '...
вопрос задан: 21 May 2019 15:27
1
ответ

Выберите строки в DataFrame на основе значений в столбце в пандах

Как выбрать строки из DataFrame на основе значений в некотором столбце в пандах? В SQL я бы использовал: SELECT * FROM table WHERE colume_name = some_value Я пытался просмотреть документацию для панд, но сделал ...
вопрос задан: 3 May 2019 19:08
1
ответ

Python Pandas - запрос и логическое значение в столбцах данных

У меня есть фрейм данных, который имеет несколько столбцов, и я хочу сделать запрос на основе нескольких критериев. Мой df (я не знаю, как выровнять столбцы по теме): Date Type IsInScope ...
вопрос задан: 14 April 2019 09:46
1
ответ

Как я могу расширить фрейм данных, который имеет от 1 строки до сотен раз

Я хочу расширить информационный фрейм, который имеет только одну строку в сотни раз (ровно 330). Есть ли способ сделать это легко? Все линии одинаковы. Фрейм данных, подобный этому: f_date f_open ...
вопрос задан: 8 April 2019 11:47
1
ответ

Печать, если несколько столбцов в датафрейме имеют определенные значения

Я хочу печатать «покупать» и «слишком дорого» каждый раз, когда два столбца имеют конкретные значения. Я попробовал это для, пока, где, где петли .... df = pd.DataFrame ({'car': ['BMW', 'BMW', 'VW', 'BMW', 'VW', 'VW'] , ...
вопрос задан: 6 April 2019 20:24
1
ответ

как расплавить фрейм данных & mdash; получить имя столбца в поле данных расплава

У меня есть df, как показано ниже имя 0 1 2 3 4 0 alex NaN NaN aa bb NaN 1 Майк NaN р-р NaN NaN NaN 2 Рэйчел сс NaN NaN NaN FF 3 Джон Джон NaF NaN ...
вопрос задан: 5 April 2019 18:06
1
ответ

Объединение двух фреймов данных в 2 столбца

введите здесь описание изображения df1 имеет 92851 рядов × 6 столбцов и введите описание изображения здесь df2 содержит 92851 рядов × 3 столбца. Но когда я пытаюсь объединить два кадра данных в один, я получаю ...
вопрос задан: 31 March 2019 07:07
1
ответ

dataframe.resample ('4T'). mean () дает неверный первый результат, но последующие результаты согласуются

"df.resample ('4T'). mean ()" дает свой первый результат перед четвертым значением кадра данных. Он продолжает точно находить среднее значение следующих четырех значений, но потому что начальное значение ...
вопрос задан: 31 March 2019 04:49
1
ответ

проверить наличие значения на другом Датафрейме

У меня есть два кадра данных F1 и F2, содержащие оба столбца id1, id2. F1 содержит два столбца F1 [id1, id2]. F2 содержит три столбца [id1, id2, Description]. Я хочу проверить, существует ли F2 ['id1'] в F1 ['id1' ...
вопрос задан: 31 March 2019 00:16
1
ответ

Pandas Dataframe groupby берет метку, включенную в массив numpy

Я хочу преобразовать pandas dataframe в пустой массив с группой по метке вместе с ним. В groupby я должен группировать с помощью регулярных выражений, поэтому важно взять с собой метку. Мои данные в формате: ...
вопрос задан: 30 March 2019 23:14
1
ответ

Как создать пустые ячейки в пандах, которые R распознает как пустые, используя rpy2?

Я пытаюсь выполнить операции ниже, которые работают нормально, за исключением проблемы с R, не признающей пустые ячейки пустыми Эта ошибка появляется, когда R жалуется, что существует более двух факторов; ...
вопрос задан: 30 March 2019 22:43
1
ответ

Как обновить столбец панд, если они имеют одинаковое значение столбцов?

Допустим, у меня есть два оригинальных DataFrame, таких как: df1 = pd.DataFrame ({"ID": [101, 102, 103], "Price": [12, 33, 44], "нечто": [12,22, 11]}) df2 = pd.DataFrame ({"ID": [101, 103], "Price": [122, 133]}) ...
вопрос задан: 28 March 2019 08:27
1
ответ

Переименовать индекс для нескольких DataFrames

У меня есть функция: def func (df): #does вещи, возвращающие df Возвращенный DataFrame выглядит следующим образом, когда я ввожу dataframe: x1 x2 x3 ret vol Я хочу изменить имя ...
вопрос задан: 28 March 2019 03:03
1
ответ

Цикл по нескольким DataFrames для выполнения одной и той же задачи

Я запускаю следующий код и получаю желаемый вывод для одного DataFrame, a: a = a.reset_index () a ['count'] = 1 a = pd.DataFrame (a.groupby (['country', 'id', 'town', 'date']) ['count']. mean ()) a = a.groupby ([...
вопрос задан: 28 March 2019 01:26
1
ответ

Python - заполнить NA значением из предыдущих строк на основе столбца идентификатора

Я хотел бы заполнить недостающее значение в 2 столбца. Есть Date и Cat2 должны быть заполнены значением другой строки на основе последней даты для предопределенного Cat1 (предопределенного в предыдущих заполненных строках),
вопрос задан: 27 March 2019 13:46
1
ответ

нужен умный цикл - сортируйте столбец DateTime и измеряйте скученность

Я хочу, чтобы оценить население ER в час. определение следующее: толпа (час = х) = люди, которые не были выписаны (час = х-1) + люди, которые присоединились (час = х) - люди, которые были выписаны (час = х)
вопрос задан: 27 March 2019 10:56
1
ответ

Конвертировать один столбец в 2d Matrix в Python

У меня есть данные, как показано ниже в одном столбце, и я хочу разбить этот единственный столбец на n количество столбцов и имена строк и столбцов. Как я могу сделать это в Python? -----------Пример данных---------- ...
вопрос задан: 27 March 2019 07:32
1
ответ

Python: очистить грязный массив данных по его значению

Я очистил веб-сайт и добавил данные каждой страницы подряд в CSV-файл. Но данные с разных страниц могут не совпадать, некоторые данные отсутствуют, поскольку веб-страница не предоставила свою информацию. ...
вопрос задан: 27 March 2019 06:24
1
ответ

Извлечение подмножества кадра данных на основе состояния, связанного с полем

У меня большой CSV с результатами медицинского обследования из разных мест (местоположение является фактором присутствует в данных). Поскольку некоторые анализы относятся к конкретному месту и для удобства, я бы ...
вопрос задан: 26 March 2019 06:59
1
ответ

Как я могу превратить этот вложенный JSON в DataFrame?

Итак, у меня есть кусок кода JSON, и я хочу превратить его в DataFrame, однако я довольно новичок в DataFrames, поэтому я немного застрял. Любая помощь будет оценена :) Так что это мой код: данные = ответ ....
вопрос задан: 24 March 2019 19:45
1
ответ

Группировка строк на основе значения столбца и сохранение строки с минимальным значением в R

В приведенном ниже наборе данных я хочу сначала проверить, какие строки для столбцов U и D имеют одинаковое значение. Затем, для такого набора строк, имеющих U и V как одно и то же значение, я хочу сохранить ту строку, которая имеет минимальное значение .
вопрос задан: 23 March 2019 00:01
1
ответ

R - заменить нулевые значения средними ненулевыми для фиксированных категорий

Мне дан набор данных следующей формы год -rep (c (1990: 1999), каждый = 10) age -rep (50:59, 10) cat1 -rep (c («A», «B») , "C", "D", "E"), каждое = 100) значение < -n-норма (10 * 10 * 5) значение [c (3,51 100,340,441)] & ...
вопрос задан: 22 March 2019 23:39
1
ответ

Как построить 2 графика, используя Seaborn в Python 3.6?

Я хочу, чтобы первый подпункт включал только «Máximo», «Média», «Mínimo», а второй - только «Amplitude», «Desvio Padrão». Я попробовал следующее: def plotGraph (title, z): #Todo Completar a ...
вопрос задан: 22 March 2019 22:13
1
ответ

Ведущие и конечные даты заполнения в Pandas DataFrame

Это мой фрейм данных: df = pd.DataFrame.from_records (data = data, coerce_float = False, index = ['date']) # поле даты datetime.datetime значения account_id количество date ...
вопрос задан: 22 March 2019 22:01
1
ответ

Панды сгруппированы суммой по одному столбцу и упорядочить результаты по другому

Я хочу, чтобы мой фрейм данных (см. Фрейм данных 1) сгруппировался по товарам и суммировал проданную сумму и упорядочил по самой старой дате продажи (т.е. см. Фрейм данных 2). Пока у меня есть код ниже: cusips_df = ...
вопрос задан: 22 March 2019 17:00
1
ответ

Как связать два столбца по строкам из двух разных фреймов данных?

# -------- Получите воскресенье с 2018-01-01 по сегодняшний день --------------------- d = seq (as.Date ("2018 -01-01 "), Sys.Date (), by = 'day') sundayList = d [weekdays (d) == 'воскресенье']
вопрос задан: 20 March 2019 05:39