0
ответов

Получить список из заголовков столбцов DataFrame от pandas

Я хочу получить список заголовков столбцов в панде DataFrame. DataFrame будет получен из пользовательского ввода, поэтому я не буду знать, сколько будет столбцов или как они будут называться. Например, ...
вопрос задан: 16 June 2019 11:48
0
ответов

Как получить количество групп в объекте groupby в пандах?

Это было бы полезно, так что я знаю, сколько уникальных групп я должен выполнить вычисления. Спасибо. Предположим, объект groupby называется dfgroup.
вопрос задан: 11 June 2019 04:26
0
ответов

Найти строку, в которой значения для столбца максимальны в pandas DataFrame

Как я могу найти строку, для которой значение определенного столбца является максимальным? df.max() даст мне максимальное значение для каждого столбца, я не знаю, как получить соответствующую строку.
вопрос задан: 7 June 2019 19:48
0
ответов

Преобразование вывода Pandas GroupBy из Series в DataFrame

Я начинаю с входных данных, таких как df1 = pandas.DataFrame ({"Name": ["Alice", "Bob", "Mallory", "Mallory", "Bob", "Mallory"], "City"): ["Сиэтл", "Сиэтл", "Портленд", "Сиэтл", "...
вопрос задан: 28 May 2019 03:53
0
ответов

Удалить столбец из панды DataFrame

При удалении столбца в DataFrame я использую: del df ['column_name'] И это прекрасно работает. Почему я не могу использовать следующее? del df.column_name Поскольку вы можете получить доступ к столбцу / Серии как df.column_name, я ...
вопрос задан: 21 May 2019 19:44
0
ответов

Столбец Pandas DataFrame к списку [дубликат]

Я извлекаю подмножество данных из столбца на основе условий в другом столбце, которые выполняются. Я могу получить правильные значения обратно, но это в pandas.core.frame.DataFrame. Как я могу преобразовать это в список? ...
вопрос задан: 20 May 2019 15:40
0
ответов

Как я могу добавить проверочные данные в данные обучения

у меня уже есть раздельные данные, 80% обучение, 20% тестирование и 20% подтверждение. Данные проверки состоят из 2 частей, каждая часть содержит 1821 данные и 1913 данные. Как я могу добавить 200 каждой части в данные обучения? Вот ...
вопрос задан: 19 May 2019 13:04
0
ответов

Python - конвертировать столбец даты и времени в секунды [дубликаты]

У меня есть столбец даты (называемый «Время»), который содержит дни / часы / минуты и т. Д. (Timedelta). Я создал новый столбец в моем фрейме данных и хочу преобразовать столбец «Время» в секунды и поместить его в ...
вопрос задан: 17 May 2019 21:31
0
ответов

Отфильтруйте фрейм данных и добавьте новый столбец в соответствии с заданным условием.

У меня есть фрейм данных, подобный этому ID col1 col2 1 Abc street 2017-07-27 1 Нет 2017-08-17 1 Def street 2018-07-15 1 Нет 2018-08-13 2 ...
вопрос задан: 14 May 2019 03:55
0
ответов

Отображать строки с одним или несколькими значениями NaN в панде

У меня есть dataframe, в котором некоторые строки содержат пропущенные значения. В [31]: df.head () Out [31]: имя файла alpha1 alpha2 gamma1 gamma2 chi2min ...
вопрос задан: 7 May 2019 09:50
0
ответов

Создание панды DataFrame из столбцов других DataFrame с аналогичными индексами

У меня есть 2 DataFrames df1 и df2 с одинаковыми именами столбцов ['a', 'b', 'c'] и проиндексированы по датам. Индекс даты может иметь аналогичные значения. Я хотел бы создать DataFrame df3 только с данными из ...
вопрос задан: 19 April 2019 06:52
0
ответов

Могу ли я использовать панд .corr для категориальной переменной?

У меня есть набор данных с некоторыми категориальными особенностями, смешанными в нем. Я хочу использовать корреляцию, чтобы сделать выбор некоторых функций. Из того, что я узнал, должно быть другое лечение для нахождения корреляции ...
вопрос задан: 14 April 2019 09:48
0
ответов

пожалуйста, разрешите этот объект Ошибка > > float 'не повторяется

Я удаляю non ascii из моих данных, мой набор данных - это прикладной английский университет St. Johns University 499 Tamkin Road Section Tamsui 251 Тайваньское отделение Roctab Английский национальный Тайвань Нормальный ...
вопрос задан: 14 April 2019 07:01
0
ответов

Как я могу получить количество строк в DataFrame панд?

Я пытаюсь получить количество строк в df с помощью Pandas, и вот мой код. Метод 1: total_rows = df.count печать total_rows +1 Метод 2: total_rows = df ['First_columnn_label']. Count ...
вопрос задан: 13 April 2019 20:08
0
ответов

Как я могу разделить фрейм данных на группы по столбцам, используя цикл for, разделяя df только по столбцам, а не по строкам [duplicate]

у меня есть датафрейм с 2000 столбцами, и я хотел бы написать быстрый код, чтобы разбить этот фрейм данных на 10 групп по 200 столбцов. df_name = ['df1', 'df2', 'df3', 'df4', 'df5', 'df6', 'df7', 'df8', 'df9', '...
вопрос задан: 13 April 2019 14:47
0
ответов

Найти все шаблоны событий

Я хотел бы найти некоторые шаблоны событий в моей базе данных. Моя база данных такая: (это всего лишь пример) -------------------- | данные | событие | -------------------- | 2007-07-03 | A | | ...
вопрос задан: 11 April 2019 15:21
0
ответов

Как векторизовать, если условие с рядом панд?

Я хочу избежать применения apply () и вместо этого векторизовать мою обработку данных. У меня есть функция, которая формирует данные на основе нескольких условий «если» и «еще» Как передать данные в эту функцию? def my_function (...
вопрос задан: 9 April 2019 08:32
0
ответов

Как разбить список внутри ячейки Dataframe на отдельные строки

Я хочу превратить ячейку панды, содержащую список в строки для каждого из этих значений. Итак, возьмем это: если я хотел бы распаковать и сложить значения в столбце near_neighbors, чтобы каждый ...
вопрос задан: 8 April 2019 19:49
0
ответов

присвойте порядковый номер переменным в python df

оценка данных калибровки Для калибровки системы мне нужно сравнить эталонные ('ref') и тестовые ('test') переменные. df выглядит следующим образом (раздел из df с> 3000 переменными): df = pd ....
вопрос задан: 8 April 2019 17:11
0
ответов

Используйте список значений, чтобы выбрать строки в кадре данных pandas [duplicate]

Допустим, у меня есть следующий фрейм данных для панд: df = DataFrame ({'A': [5,6,3,4], 'B': [1,2,3, 5]}) df AB 0 5 1 1 6 2 2 3 3 3 4 5 Я могу подмножество на основе определенного значения: ...
вопрос задан: 7 April 2019 22:24
0
ответов

Как нормализовать столбец информационного кадра, игнорируя в нем значения None?

Я пытаюсь нормализовать столбец данных, который также содержит значения None, как мне это сделать с помощью лямбда-функции? Я пытался использовать: df ['Log ВВП на душу населения'] = df ['Log ВВП на душу населения']. Apply (...
вопрос задан: 7 April 2019 16:35
0
ответов

Переименовать определенные столбцы в пандах

У меня есть датафрейм под названием data. Как бы я переименовал только один заголовок столбца? Например GDP для входа (GDP)? data = y gdp cap 0 1 2 5 1 2 3 9 2 8 7 2 3 3 4 7 4 ...
вопрос задан: 7 April 2019 09:42
0
ответов

разделить одну и ту же ось x на 2 разных гистограммах графика данных

Я хотел бы построить две гистограммы для 2 разных кадров данных панд, используя одну и ту же ось X, используя запонки (или, если это невозможно, просто график), следуя кодовым графикам 2 разных графиков,
вопрос задан: 6 April 2019 11:25
0
ответов

Как сгруппировать несколько значений строк (все float64), где значения столбцов (Artist, Track и Date) одинаковы?

Моя цель - отобразить DataFrame, который отображает уникальные данные Artist, Track и Date с соответствующими столбцами float64 (количество потоков Spotify, количество потоков Apple, загрузок). Что-то вроде этого: ...
вопрос задан: 5 April 2019 09:41
0
ответов

Почему сгруппированный фрейм данных дает ключ и данные в цикле for, но не работает с помощью map ()?

Рассмотрим пример использования ниже, когда я использую цикл for, я могу получить доступ и к ключу, и к сгруппированным данным, но при попытке абстрагировать цикл for при использовании map () я получаю следующую ошибку: raw_data = {'...
вопрос задан: 4 April 2019 23:10
0
ответов

Как построить базу данных файлов HDF5

Я изучал возможности хранения данных HDF5 и нашел его полезным для хранения больших результатов. У меня есть куча файлов hdf5 на моей локальной машине, с другой иерархической структурой. ...
вопрос задан: 4 April 2019 10:00
0
ответов

Как увеличить скорость ввода-вывода в db call с python?

Необходимо импортировать 15 миллионов строк за один запрос. От oracle db до pandas dataframe в python через sqlalchemy Я пробовал простой запрос БД с использованием sqlalchemy. Я хотел бы попробовать мульти-обработку, ...
вопрос задан: 31 March 2019 15:50
0
ответов

Как применить мою модель к новым данным после тестирования и оценки?

Я использовал модель логистической регрессии для набора данных, чтобы предсказать метку. Я обучил 70% данных и протестировал оставшиеся 30%. Теперь у меня есть новые данные с неизвестной меткой, и я хочу применить свою модель к ...
вопрос задан: 31 March 2019 15:36
0
ответов

Добавление фреймов данных в файл Excel с разным количеством столбцов

У меня есть несколько CSV-файлов с различным количеством столбцов (например, CSV-файл будет иметь 10 столбцов, а другой, возможно, имеет 5 столбцов.), И все CSV-файлы имеют заголовок столбца. Теперь давайте ...
вопрос задан: 30 March 2019 21:57
0
ответов

Побитовая функция большинства между столбцами

Я пытаюсь реализовать эффективную функцию побитового большинства между столбцами данных. Чтобы упростить задачу, я показываю транспонированный столбец ниже (столбцы 0,1,2,3 и один конкретный ...
вопрос задан: 29 March 2019 16:15