Я хочу получить список заголовков столбцов в панде DataFrame. DataFrame будет получен из пользовательского ввода, поэтому я не буду знать, сколько будет столбцов или как они будут называться. Например, ...
Как я могу найти строку, для которой значение определенного столбца является максимальным? df.max() даст мне максимальное значение для каждого столбца, я не знаю, как получить соответствующую строку.
Я начинаю с входных данных, таких как df1 = pandas.DataFrame ({"Name": ["Alice", "Bob", "Mallory", "Mallory", "Bob", "Mallory"], "City"): ["Сиэтл", "Сиэтл", "Портленд", "Сиэтл", "...
При удалении столбца в DataFrame я использую: del df ['column_name'] И это прекрасно работает. Почему я не могу использовать следующее? del df.column_name Поскольку вы можете получить доступ к столбцу / Серии как df.column_name, я ...
Я извлекаю подмножество данных из столбца на основе условий в другом столбце, которые выполняются. Я могу получить правильные значения обратно, но это в pandas.core.frame.DataFrame. Как я могу преобразовать это в список? ...
у меня уже есть раздельные данные, 80% обучение, 20% тестирование и 20% подтверждение. Данные проверки состоят из 2 частей, каждая часть содержит 1821 данные и 1913 данные. Как я могу добавить 200 каждой части в данные обучения? Вот ...
У меня есть столбец даты (называемый «Время»), который содержит дни / часы / минуты и т. Д. (Timedelta). Я создал новый столбец в моем фрейме данных и хочу преобразовать столбец «Время» в секунды и поместить его в ...
У меня есть dataframe, в котором некоторые строки содержат пропущенные значения. В [31]: df.head () Out [31]: имя файла alpha1 alpha2 gamma1 gamma2 chi2min ...
У меня есть 2 DataFrames df1 и df2 с одинаковыми именами столбцов ['a', 'b', 'c'] и проиндексированы по датам. Индекс даты может иметь аналогичные значения. Я хотел бы создать DataFrame df3 только с данными из ...
У меня есть набор данных с некоторыми категориальными особенностями, смешанными в нем. Я хочу использовать корреляцию, чтобы сделать выбор некоторых функций. Из того, что я узнал, должно быть другое лечение для нахождения корреляции ...
Я удаляю non ascii из моих данных, мой набор данных - это прикладной английский университет St. Johns University 499 Tamkin Road Section Tamsui 251 Тайваньское отделение Roctab Английский национальный Тайвань Нормальный ...
Я пытаюсь получить количество строк в df с помощью Pandas, и вот мой код. Метод 1: total_rows = df.count печать total_rows +1 Метод 2: total_rows = df ['First_columnn_label']. Count ...
у меня есть датафрейм с 2000 столбцами, и я хотел бы написать быстрый код, чтобы разбить этот фрейм данных на 10 групп по 200 столбцов. df_name = ['df1', 'df2', 'df3', 'df4', 'df5', 'df6', 'df7', 'df8', 'df9', '...
Я хотел бы найти некоторые шаблоны событий в моей базе данных. Моя база данных такая: (это всего лишь пример) -------------------- | данные | событие | -------------------- | 2007-07-03 | A | | ...
Я хочу избежать применения apply () и вместо этого векторизовать мою обработку данных. У меня есть функция, которая формирует данные на основе нескольких условий «если» и «еще» Как передать данные в эту функцию? def my_function (...
Я хочу превратить ячейку панды, содержащую список в строки для каждого из этих значений. Итак, возьмем это: если я хотел бы распаковать и сложить значения в столбце near_neighbors, чтобы каждый ...
оценка данных калибровки Для калибровки системы мне нужно сравнить эталонные ('ref') и тестовые ('test') переменные. df выглядит следующим образом (раздел из df с> 3000 переменными): df = pd ....
Допустим, у меня есть следующий фрейм данных для панд: df = DataFrame ({'A': [5,6,3,4], 'B': [1,2,3, 5]}) df AB 0 5 1 1 6 2 2 3 3 3 4 5 Я могу подмножество на основе определенного значения: ...
Я пытаюсь нормализовать столбец данных, который также содержит значения None, как мне это сделать с помощью лямбда-функции? Я пытался использовать: df ['Log ВВП на душу населения'] = df ['Log ВВП на душу населения']. Apply (...
У меня есть датафрейм под названием data. Как бы я переименовал только один заголовок столбца? Например GDP для входа (GDP)? data = y gdp cap 0 1 2 5 1 2 3 9 2 8 7 2 3 3 4 7 4 ...
Я хотел бы построить две гистограммы для 2 разных кадров данных панд, используя одну и ту же ось X, используя запонки (или, если это невозможно, просто график), следуя кодовым графикам 2 разных графиков,
Моя цель - отобразить DataFrame, который отображает уникальные данные Artist, Track и Date с соответствующими столбцами float64 (количество потоков Spotify, количество потоков Apple, загрузок). Что-то вроде этого: ...
Рассмотрим пример использования ниже, когда я использую цикл for, я могу получить доступ и к ключу, и к сгруппированным данным, но при попытке абстрагировать цикл for при использовании map () я получаю следующую ошибку: raw_data = {'...
Я изучал возможности хранения данных HDF5 и нашел его полезным для хранения больших результатов. У меня есть куча файлов hdf5 на моей локальной машине, с другой иерархической структурой. ...
Необходимо импортировать 15 миллионов строк за один запрос. От oracle db до pandas dataframe в python через sqlalchemy Я пробовал простой запрос БД с использованием sqlalchemy. Я хотел бы попробовать мульти-обработку, ...
Я использовал модель логистической регрессии для набора данных, чтобы предсказать метку. Я обучил 70% данных и протестировал оставшиеся 30%. Теперь у меня есть новые данные с неизвестной меткой, и я хочу применить свою модель к ...
У меня есть несколько CSV-файлов с различным количеством столбцов (например, CSV-файл будет иметь 10 столбцов, а другой, возможно, имеет 5 столбцов.), И все CSV-файлы имеют заголовок столбца. Теперь давайте ...
Я пытаюсь реализовать эффективную функцию побитового большинства между столбцами данных. Чтобы упростить задачу, я показываю транспонированный столбец ниже (столбцы 0,1,2,3 и один конкретный ...