Я помещаю .describe () в Dataframe, результат выглядит не очень хорошо. Я хочу, чтобы выходные данные отображали целое число, а не упрощались экспонентами. Ввод: df ["A"]. Description () Как выглядит вывод ...
У меня есть два столбца в панде dataframe, дата начала и дата окончания. Я хочу знать, включен ли какой-либо праздник в период времени каждой строки. Я хочу создать новый столбец, чтобы показать да или нет. Я бы ...
У меня есть набор данных с огромным количеством функций, поэтому анализ матрицы корреляции стал очень трудным. Я хочу построить корреляционную матрицу, которую мы получаем с помощью функции dataframe.corr () из ...
Я хочу добавить столбец значений в существующий фрейм данных, присваивая значения соответствующим индексам. Это мой фрейм данных df ID 0 A 1 B 2 C Я хочу добавить значение ...
Я работаю с кадром данных из CSV-файла, и я хочу, чтобы удалить определенную строку. Я попытался использовать df2 [df2.State! = 'INDIA'], где INDIA - строка, которую я хочу удалить. Вот пример кадра данных: ...
Я использую панды, чтобы прочитать файл Excel, который содержит данные о землетрясениях за последние 10 лет. Однако числа (точнее десятичная часть), кажется, меняются, когда я читаю на Python. ...
У меня есть файл от SAP, который не был самым красивым при работе с данными. Поэтому, используя series.str.contains () и логические маски, мне удалось сузить область данных до следующей:
Мне нужно посчитать, сколько раз значения списка появляются в столбце другого DataFrame. Я пытался использовать df ['Column']. Value_counts (). Однако, если значение находится в списке, но не в ...
У меня есть такой похожий кадр данных, как показано ниже: - ХОРОШО RESV ТИПА X1 Y1 X2 Y2 TD2 0 W1 A OP 100 250 500 -5 495 1 W2 B INJ 120 255 700 -7 695 2 W3 B OBS 140 260 ...
пытаясь сравнить последовательность строк с упорядоченным словарем и использовать .lower (). contains ('word') и извлечь значение словаря pandas импорта как pd из коллекций import OrderedDict df = pd ....
У меня есть фрейм данных, в котором есть все уникальные столбцы, однако после создания я должен переименовать столбцы с их псевдонимом поля. Некоторые псевдонимы полей являются дубликатами, в этом случае эти столбцы должны быть ...
У меня есть дубликаты клиентов с различным статусом, потому что есть строка для каждой подписки / продукта клиента. Я хочу сгенерировать новый_статус для клиента и для его отмены, каждый ...
У меня есть Python dataframe, где столбец имеет элементы, начинающиеся с pjp- и заканчивающиеся на |, например pjp-XYA |, я хочу удалить все из pjp- до первого появления «|» в пандах ...
У меня есть два кадра данных (A & B). Для каждой строки в AI хотел бы найти некоторую информацию, которая находится в B. Я попытался: A = pd.DataFrame ({'X': [1,2]}, index = [4,5]) B = pd. DataFrame ({'Y': [3,4,5]}, ...
Как я могу переименовать последний столбец в кадре данных, который был передан в цепочке методов? Подумайте о следующем примере (реальный вариант использования более сложный). Как функция переименования может ссылаться на ...
Я хочу создать столбец pandas «Ссылка» на основе двух других столбцов (URL и заголовок), чтобы создать столбец, который будет содержать тег HTML-ссылки с заголовком в форме: < a href = "{}" > {} < / а > 'формат (DF [.' ...
У меня есть 100 CSV-файлов. Каждый файл содержит столбцы, которые могут быть или не быть в других файлах .csv. Мне нужно объединить все файлы CSV в один и суммировать все столбцы, которые имеют одинаковое имя столбца. Ниже ...
У меня есть 2 кадра данных. Первый фрейм данных имеет номера в качестве индекса. Второй фрейм данных имеет дату и время в качестве индекса. Оператор слайса (:) ведет себя по-разному на этих информационных кадрах. Случай 1 > > df = pd ....
У меня есть что-то вроде следующего кадра в формате csv: Страна Статус People_elptable_Count XYZ True 100000 XYZ False 14000 XYZ Not Ap 360000 Я хочу включить вышеуказанное ...
У меня есть эти коды, и мне нужно создать фрейм данных, похожий на прикрепленную картинку - спасибо pandas импорта как pd Product = [(100, 'Item1, Item2'), (101, 'Item1, Item3'), (102, ' ...
Я использовал эту функцию для создания объекта временных рядов в Pandas, который возвращает (OLS?) Наиболее подходящий наклон данного диапазона точек: def best_fit (X, Y): xbar = sum (X) / len (X) ybar = ...
У меня есть 4 разных файла CSV, которые я хочу объединить (объединить). Основной файл содержит все столбцы и идентификатор (объединить столбец) для одного из других файлов. Например, основной файл ...
Строка моих данных имеет 18 столбцов, каждый из которых имеет код усложнения. Класс сложности состоит из «имени», которое является именем сложности, такого как «HeartFailure», и имеет также массив ...
Есть довольно интересный случай. Существует df_1 со столбцом времени на основе данных с малой гранулярностью (2 с), например: 2018-08-31 22: 59: 47.980000 + 00: 00 41.77 2018-08-31 22: 59: 49.979000 + 00: 00 42.76 ,
Я пытаюсь модулировать мой код Python. В своем основном коде записную книжку я вставляю это: импортировать numpy как np, импортировать pandas как pd из pandas import DataFrame import my_math df ["std_line_amount_log_normal"] ...
У меня проблемы с использованием измененных данных с пандами. Представьте, что у меня есть датафрейм в длинном формате, например: город год, тип var1 var2 a 2010 a 100 200 b 2010 a ...