2
ответа

Как изменить формат вывода .describe ()?

Я помещаю .describe () в Dataframe, результат выглядит не очень хорошо. Я хочу, чтобы выходные данные отображали целое число, а не упрощались экспонентами. Ввод: df ["A"]. Description () Как выглядит вывод ...
вопрос задан: 28 March 2019 14:02
2
ответа

Как рассчитать агрегированную сводную статистику в кадре данных Pandas

У меня есть кадр данных Pandas, похожий на этот: > > > df = pd.DataFrame (data = np.array ([['red', 'cup', 1.50], ['blue', 'jug', 2.40], ['red', 'cup', 1.75], [ «синий», «чашка», 2,30]]), ... ...
вопрос задан: 28 March 2019 00:52
2
ответа

Как проверить, включен ли какой-либо праздник в период времени в питоне

У меня есть два столбца в панде dataframe, дата начала и дата окончания. Я хочу знать, включен ли какой-либо праздник в период времени каждой строки. Я хочу создать новый столбец, чтобы показать да или нет. Я бы ...
вопрос задан: 28 March 2019 00:18
2
ответа

Матрица корреляции участков с использованием панд

У меня есть набор данных с огромным количеством функций, поэтому анализ матрицы корреляции стал очень трудным. Я хочу построить корреляционную матрицу, которую мы получаем с помощью функции dataframe.corr () из ...
вопрос задан: 27 March 2019 16:30
2
ответа

Dataframe - присваивать значения соответствующим индексам

Я хочу добавить столбец значений в существующий фрейм данных, присваивая значения соответствующим индексам. Это мой фрейм данных df ID 0 A 1 B 2 C Я хочу добавить значение ...
вопрос задан: 26 March 2019 21:46
2
ответа

Удалите ряд панд по имени, сохраните индекс без изменений

Я работаю с кадром данных из CSV-файла, и я хочу, чтобы удалить определенную строку. Я попытался использовать df2 [df2.State! = 'INDIA'], где INDIA - строка, которую я хочу удалить. Вот пример кадра данных: ...
вопрос задан: 25 March 2019 16:25
2
ответа

Панды меняют числа при чтении из Excel [дубликаты]

Я использую панды, чтобы прочитать файл Excel, который содержит данные о землетрясениях за последние 10 лет. Однако числа (точнее десятичная часть), кажется, меняются, когда я читаю на Python. ...
вопрос задан: 24 March 2019 20:12
2
ответа

Панды группового транспонирования

У меня есть файл от SAP, который не был самым красивым при работе с данными. Поэтому, используя series.str.contains () и логические маски, мне удалось сузить область данных до следующей:
вопрос задан: 24 March 2019 15:17
2
ответа

Как подсчитать вхождения значений списка в столбец другого фрейма данных?

Мне нужно посчитать, сколько раз значения списка появляются в столбце другого DataFrame. Я пытался использовать df ['Column']. Value_counts (). Однако, если значение находится в списке, но не в ...
вопрос задан: 24 March 2019 03:31
2
ответа

Цикл по группам, чтобы сделать операцию на

У меня есть такой похожий кадр данных, как показано ниже: - ХОРОШО RESV ТИПА X1 Y1 X2 Y2 TD2 0 W1 A OP 100 250 500 -5 495 1 W2 B INJ 120 255 700 -7 695 2 W3 B OBS 140 260 ...
вопрос задан: 22 March 2019 20:35
2
ответа

сопоставить упорядоченный словарь по серии

пытаясь сравнить последовательность строк с упорядоченным словарем и использовать .lower (). contains ('word') и извлечь значение словаря pandas импорта как pd из коллекций import OrderedDict df = pd ....
вопрос задан: 22 March 2019 16:37
2
ответа

преобразовать DataFrame, используя панд [дубликат]

Я бы преобразовал свой DataFrame, используя панд Python: l1 = ['andre', 'Marc'] l2 = [5,12] l3 = [3,64] dfWeeks = pd.DataFrame (list (zip (l1, l2, l3) )), columns = ['Name', '22-2019', '23-2019']) dfWeeks Похоже ...
вопрос задан: 22 March 2019 10:33
2
ответа

Объединение повторяющихся столбцов в панде

У меня есть фрейм данных, в котором есть все уникальные столбцы, однако после создания я должен переименовать столбцы с их псевдонимом поля. Некоторые псевдонимы полей являются дубликатами, в этом случае эти столбцы должны быть ...
вопрос задан: 21 March 2019 16:57
2
ответа

Панды Подать заявку с условием

У меня есть дубликаты клиентов с различным статусом, потому что есть строка для каждой подписки / продукта клиента. Я хочу сгенерировать новый_статус для клиента и для его отмены, каждый ...
вопрос задан: 19 March 2019 21:25
2
ответа

удалить вхождение шаблона в датафрейме Python Pandas

У меня есть Python dataframe, где столбец имеет элементы, начинающиеся с pjp- и заканчивающиеся на |, например pjp-XYA |, я хочу удалить все из pjp- до первого появления «|» в пандах ...
вопрос задан: 19 March 2019 19:21
2
ответа

Строка поиска в кадре данных панд

У меня есть два кадра данных (A & B). Для каждой строки в AI хотел бы найти некоторую информацию, которая находится в B. Я попытался: A = pd.DataFrame ({'X': [1,2]}, index = [4,5]) B = pd. DataFrame ({'Y': [3,4,5]}, ...
вопрос задан: 19 March 2019 17:18
2
ответа

Python DataFrame GroupBay или Pivot_table

Пример: импорт панд в виде данных pd = {'id': [101,101,101,101,102,102,102,102], 'day': [1,2,1,2,1,2,1,2], 'year': [2011,2011,2012, 2012,2011,2011,2012,2012], 'avg': [0,500,0.400,0.300,0.200,0 ....
вопрос задан: 19 March 2019 14:25
2
ответа

Переименовать последний столбец в кадре данных, переданном в цепочке методов

Как я могу переименовать последний столбец в кадре данных, который был передан в цепочке методов? Подумайте о следующем примере (реальный вариант использования более сложный). Как функция переименования может ссылаться на ...
вопрос задан: 19 March 2019 14:03
2
ответа

Отображение 2 столбцов в пандах на третий

Я хочу создать столбец pandas «Ссылка» на основе двух других столбцов (URL и заголовок), чтобы создать столбец, который будет содержать тег HTML-ссылки с заголовком в форме: < a href = "{}" > {} < / а > 'формат (DF [.' ...
вопрос задан: 19 March 2019 07:36
2
ответа

Pandas: объединяет несколько файлов .csv и возвращает Dataframe с агрегированными столбцами с одинаковым именем

У меня есть 100 CSV-файлов. Каждый файл содержит столбцы, которые могут быть или не быть в других файлах .csv. Мне нужно объединить все файлы CSV в один и суммировать все столбцы, которые имеют одинаковое имя столбца. Ниже ...
вопрос задан: 19 March 2019 07:35
2
ответа

Непоследовательное поведение нарезки [:] на Пандах

У меня есть 2 кадра данных. Первый фрейм данных имеет номера в качестве индекса. Второй фрейм данных имеет дату и время в качестве индекса. Оператор слайса (:) ведет себя по-разному на этих информационных кадрах. Случай 1 > > df = pd ....
вопрос задан: 19 March 2019 06:53
2
ответа

Разобрать фрейм данных

У меня есть что-то вроде следующего кадра в формате csv: Страна Статус People_elptable_Count XYZ True 100000 XYZ False 14000 XYZ Not Ap 360000 Я хочу включить вышеуказанное ...
вопрос задан: 18 March 2019 17:30
2
ответа

Создать новые строки из столбцов с несколькими элементами в Python

У меня есть эти коды, и мне нужно создать фрейм данных, похожий на прикрепленную картинку - спасибо pandas импорта как pd Product = [(100, 'Item1, Item2'), (101, 'Item1, Item3'), (102, ' ...
вопрос задан: 18 March 2019 16:08
2
ответа

Конвертируйте функцию Pandas, наиболее подходящую в pyspark

Я использовал эту функцию для создания объекта временных рядов в Pandas, который возвращает (OLS?) Наиболее подходящий наклон данного диапазона точек: def best_fit (X, Y): xbar = sum (X) / len (X) ybar = ...
вопрос задан: 18 March 2019 16:06
2
ответа

Объединить (объединить) 4 разных файла CSV с разными идентификаторами и несколькими значениями с помощью DataFrames

У меня есть 4 разных файла CSV, которые я хочу объединить (объединить). Основной файл содержит все столбцы и идентификатор (объединить столбец) для одного из других файлов. Например, основной файл ...
вопрос задан: 18 March 2019 11:54
2
ответа

Возникли проблемы с оптимизацией этого кода, интересно, почему он работает так медленно - как я могу оптимизировать этот код?

Строка моих данных имеет 18 столбцов, каждый из которых имеет код усложнения. Класс сложности состоит из «имени», которое является именем сложности, такого как «HeartFailure», и имеет также массив ...
вопрос задан: 17 March 2019 23:34
2
ответа

Панды Слияние двух датафреймов с объединением по дате между датами

Есть довольно интересный случай. Существует df_1 со столбцом времени на основе данных с малой гранулярностью (2 с), например: 2018-08-31 22: 59: 47.980000 + 00: 00 41.77 2018-08-31 22: 59: 49.979000 + 00: 00 42.76 ,
вопрос задан: 17 March 2019 20:49
2
ответа

неизвестная библиотека, когда модульный код Python

Я пытаюсь модулировать мой код Python. В своем основном коде записную книжку я вставляю это: импортировать numpy как np, импортировать pandas как pd из pandas import DataFrame import my_math df ["std_line_amount_log_normal"] ...
вопрос задан: 13 March 2019 17:00
2
ответа

Панды любые 4 дня подряд в последние 15 дней питона

У меня есть такой фрейм данных как pandas импорта: pd raw_data = {'ID': ['101', '101', '101', '101', '101', '101', '102', '102', ' 102 ',' 102 ',' 102 ',' 103 ',' 103 ',' 103 ',' 103 ',' 102 ',' 102 ',' 102 ',' 102 ',' ...
вопрос задан: 11 March 2019 17:43
2
ответа

Работа с результатом pandas.pivot_table

У меня проблемы с использованием измененных данных с пандами. Представьте, что у меня есть датафрейм в длинном формате, например: город год, тип var1 var2 a 2010 a 100 200 b 2010 a ...
вопрос задан: 11 March 2019 13:32