1
ответ

Как извлечь параметры из списка в словаре в отдельные столбцы как числа с плавающей запятой?

У меня трудности с извлечением значений из словаря. Словарь включает в себя список, который содержит пару числовых значений, которые представляют интерес, и я намерен извлечь их и сохранить ...
вопрос задан: 30 March 2019 23:07
1
ответ

Как создать пустые ячейки в пандах, которые R распознает как пустые, используя rpy2?

Я пытаюсь выполнить операции ниже, которые работают нормально, за исключением проблемы с R, не признающей пустые ячейки пустыми Эта ошибка появляется, когда R жалуется, что существует более двух факторов; ...
вопрос задан: 30 March 2019 22:43
1
ответ

Как я могу заменить df.iterrows () на df.apply () в Pandas?

У меня есть следующий цикл: dict1 = {} dict2 = {} для (я, строка) в DF [['Col1', 'Col2', 'Col3']]. ']] = строка [' col2 '] dict2 [строка [' col1 ']] = строка [' col3 '] ...
вопрос задан: 29 March 2019 12:10
1
ответ

Из & ldquo; nested & rdquo; DataFrame для вложенного Json [дубликата]

У меня есть DataFrame, который содержит псевдо-вложенные столбцы (то есть, как имя), созданные с помощью функции Панды 'json_normalize' во вложенном JSON. Я хотел бы построить JSON из DataFrame, который имеет ...
вопрос задан: 29 March 2019 11:59
1
ответ

Как объединить кадры данных временных рядов, 15 минут и 10 минут, в 30 минут

У меня проблема с подготовкой данных, у меня есть два кадра данных временных рядов, которые я хочу объединить в 30-минутный интервал. Первый набор данных находится в 10-минутном интервале, в то время как другие в 15 ...
вопрос задан: 29 March 2019 10:17
1
ответ

Цикл по словарю фреймов данных

У меня есть набор информационных фреймов, которые представляют сценарии спроса, которые я поместил в словарь. Мне нужно перебрать каждый фрейм данных в словаре для переиндексации и повторной выборки и т. Д. И возврата к ...
вопрос задан: 28 March 2019 17:01
1
ответ

Как drop_duplicate, используя разные условия для группы?

У меня есть dataFrame, и мне нужно удалить дубликаты на группу ('col1') на основе минимального значения в другом столбце 'abs (col1 - col2)', но мне нужно изменить это условие для последней группы, взяв ...
вопрос задан: 28 March 2019 14:10
1
ответ

Как обновить столбец панд, если они имеют одинаковое значение столбцов?

Допустим, у меня есть два оригинальных DataFrame, таких как: df1 = pd.DataFrame ({"ID": [101, 102, 103], "Price": [12, 33, 44], "нечто": [12,22, 11]}) df2 = pd.DataFrame ({"ID": [101, 103], "Price": [122, 133]}) ...
вопрос задан: 28 March 2019 08:27
1
ответ

Как преобразовать список в DataFrame по строкам

Как я могу хранить мудрые строки данных в pandas dataframe с предопределенными именами столбцов через цикл? Это для извлечения текста из изображений. df = pd.DataFrame (columns = ['Col1', 'Col2', 'Col3', 'Col4', 'Col5' ...
вопрос задан: 28 March 2019 07:34
1
ответ

Pandas Dataframe заменяет Nan из строки, когда значение столбца соответствует

У меня есть датафрейм, т. Е. Входной класс данных фрейма, подклассы школы, города 0 I A Eng 80 jghss salem 1 I A Mat 90 jghss salem 2 I A ...
вопрос задан: 28 March 2019 05:35
1
ответ

Оператор `in` не работает должным образом при проверке, содержит ли серия панд заданное значение

У меня есть следующие серии ZAR, которые содержат метки времени: В [743]: Zar Out [743]: 0 2019-01-01 1 2019-03-21 2 2019-04-19 3 2019-04-22 4 2019-04 27 5 2019-05-01 6 2019-06-17 7 2019-08 -...
вопрос задан: 28 March 2019 04:58
1
ответ

Группировка наблюдений по времени отключения

У меня есть список времен отсечения = 16: 30: 00.100, 16: 30: 00.200, 16: 30: 00.350, 16: 30: 00.450] И мои наблюдения таковы: 16: 30: 00.095 A 16: 30: 00.097 B 16: 30: 00.122 C 16: 30: 00.255 ...
вопрос задан: 28 March 2019 03:47
1
ответ

Как сократить время выполнения программы, заменив цикл в пандах

У меня есть 12000 CSV-файлов, каждый файл имеет 6000 строк. я использую для цикла в моем коде, я думаю, из-за этого мое время выполнения кода увеличилось. если кто-нибудь знает, как изменить этот кусок кода в ...
вопрос задан: 28 March 2019 03:47
1
ответ

Переименовать индекс для нескольких DataFrames

У меня есть функция: def func (df): #does вещи, возвращающие df Возвращенный DataFrame выглядит следующим образом, когда я ввожу dataframe: x1 x2 x3 ret vol Я хочу изменить имя ...
вопрос задан: 28 March 2019 03:03
1
ответ

Как построить матрицу распределений Seaborn для всех столбцов в кадре данных

Представьте, что у меня есть датафрейм с 9 столбцами. Я хочу иметь возможность добиться того же эффекта, что и df.hist (), но с помощью sns.distplot (). Другими словами, я хочу быть в состоянии построить sns.distplot () для каждого ...
вопрос задан: 28 March 2019 02:20
1
ответ

Цикл по нескольким DataFrames для выполнения одной и той же задачи

Я запускаю следующий код и получаю желаемый вывод для одного DataFrame, a: a = a.reset_index () a ['count'] = 1 a = pd.DataFrame (a.groupby (['country', 'id', 'town', 'date']) ['count']. mean ()) a = a.groupby ([...
вопрос задан: 28 March 2019 01:26
1
ответ

Удалить строки, если они существуют в предыдущей группе

У меня есть объект GroupBy. Я хочу удалить строки из текущей группы, если такая же строка существует в предыдущей группе. Допустим, это (n-1) -я группа: A B 0 foo 0 1 baz 1 2 foo 1 3 bar 1 ...
вопрос задан: 28 March 2019 01:23
1
ответ

Почему я не получаю промежуточный итог строк

Я пытаюсь получить промежуточный итог, используя поворот панд. Я не знаю, почему я получаю только промежуточный итог колонки? data = {'TypeOfInvestor': ['Акции', 'Облигации', 'Недвижимость'], 'InvestorA': [96, ...
вопрос задан: 28 March 2019 01:20
1
ответ

добавить значение в столбец из функции .apply

Я пытаюсь применить простое значение к столбцу в моем фрейме панды, но всегда показывает NaN, я не могу найти причину, почему. вот мой код def get_extra_hours (value): вернуть f '{value [12] -40: .2f}' ...
вопрос задан: 27 March 2019 15:08
1
ответ

Python - заполнить NA значением из предыдущих строк на основе столбца идентификатора

Я хотел бы заполнить недостающее значение в 2 столбца. Есть Date и Cat2 должны быть заполнены значением другой строки на основе последней даты для предопределенного Cat1 (предопределенного в предыдущих заполненных строках),
вопрос задан: 27 March 2019 13:46
1
ответ

нужен умный цикл - сортируйте столбец DateTime и измеряйте скученность

Я хочу, чтобы оценить население ER в час. определение следующее: толпа (час = х) = люди, которые не были выписаны (час = х-1) + люди, которые присоединились (час = х) - люди, которые были выписаны (час = х)
вопрос задан: 27 March 2019 10:56
1
ответ

В пандах я использую отчеты НЛО. Я хочу получить состояние, которое сформировало отчетный овал.

Я использую отчеты НЛО в пандах. Я хочу, чтобы состояние, которое имеет форму, сообщило "овальный" ... поэтому я пишу: ufo.groupby ("State"). Shape_Reported == "Oval" Это показывает мне False как вывод .. pls помогите мне.pls
вопрос задан: 27 March 2019 09:13
1
ответ

Как построить точечную диаграмму, используя фрейм данных pandas, где значения оси x равны n минус 1 столбцу, а последний столбец является зависимой переменной?

У меня есть датафрейм (df), скажем, он имеет 12 столбцов. Мне нужно построить диаграммы рассеяния 11 из этих столбцов (мои независимые переменные) относительно одного столбца (моя зависимая переменная). Другими словами, если ...
вопрос задан: 27 March 2019 03:39
1
ответ

Изменить форму DataFrame с длинного на широкий вдоль одного столбца

Я ищу способ перенастроить приведенную ниже таблицу A в таблицу B. Таблица A: тип x1 x2 x3 A 4 6 9 A 7 4 1 A 9 6 2 B 1 3 8 B 2 7 9 ...
вопрос задан: 27 March 2019 00:23
1
ответ

Фильтр данных Pandas на основе условия для первых n строк

У меня есть данные формы [600 000, 19]. Я хочу отфильтровать первые 100 000 строк на основе одного условия, следующие 300 000 строк на основе другого условия и 3-е условие для последних строк. Я был ...
вопрос задан: 26 March 2019 23:40
1
ответ

панды & ldquo; isin & rdquo; намного медленнее, чем numpy & ldquo; in1d & rdquo;

Существует огромная разница между пандами "isin" и numpy "in1d" с точки зрения эффективности. После некоторых исследований я заметил, что тип данных и значений, которые передаются в качестве параметра в "...
вопрос задан: 26 March 2019 14:52
1
ответ

Не удается добавить заголовки столбцов к кадру данных при использовании to_dict () в пандах

У меня есть парные ключи / значения в виде переменных (datetime / object), и у меня возникают проблемы с добавлением заголовка и dtypes к типам данных. Я могу сделать dataframe без заголовков столбцов и dtype объекта ...
вопрос задан: 26 March 2019 14:50
1
ответ

Как изменить тип данных значений в пандах

У меня есть pandas dataframe, который имеет как float, так и numpy массивы, как показано ниже. имя x1 x2 X3 0 a 4.7 [0.] 3 1 b 3.2 [1.7] 5 2 e 1.2 [2.] 6 I ...
вопрос задан: 26 March 2019 14:27
1
ответ

Конвертировать JSON в pd.DataFrame

Я не могу преобразовать этот код в df. Я пробовал df = pd.read_json ('australian_user_reviews.json') и у меня ошибка: ValueError: Ожидаемый объект или значение {'user_id': '76561197970982479', 'user_url': 'http: / / ...
вопрос задан: 25 March 2019 14:13
1
ответ

Ошибка экспорта в Pandas to_excel: объект DataFrame не имеет атрибута data

Я использую следующий код, чтобы попытаться создать фрейм данных из векторизатора Tf-Idf. Вывод векторизатора fit_transform представляет собой разреженную матрицу, поэтому я использую toarray () для преобразования в массив, а затем в pandas ....
вопрос задан: 25 March 2019 08:07