У меня есть словарь, который представляет набор продуктов. Мне нужно найти все дубликаты продуктов в этих продуктах. Если продукты имеют одинаковый product_type, цвет и размер -> они являются дубликатами. Я мог бы ...
У меня есть два столбца в кадре данных df: A B 0 NaN NaN 1 3,14 NaN 2 NaN 4,20 3 3,65 0,68 Ожидаемый результат для df: A B C 0 NaN NaN NaN 1 3,14 NaN 3,14 2 NaN 4,20 4,20 3 3,65 ...
Ошибка в df $ лошадиных силах: объект типа 'замыкание' не является поднабором `библиотека (nnet) библиотека (ISLR) df < - Auto df < - na.omit (df) glimpse (df) имена строк (df) < - c () neural_formul = df $ ...
У меня есть ненулевой dataframe df, который имеет около 100 столбцов. Я хочу удалить выбросы из каждого столбца, для чего я делаю следующее. df1 = df [np.abs (df - df.mean ()) < = (3 * df.std ())] Я бы ...
Мне нужен способ объединить и развернуть два кадра данных. Так что в этом упрощенном примере мне нужно объединить по типу и развернуть график так, чтобы он появлялся в каждой строке нового фрейма данных, где он соответствует типу. ...
У меня есть набор данных GPS (в формате CSV) сотен людей, и я должен изучить мобильность их. Мне удалось вычислить расстояние между каждой из двух точек, а затем вычислить скорость по ...
У меня есть 2 разных кадра данных, например, и мне нужно добавить столбец «Present In» к первому кадру данных, в котором перечислены все элементы в C, которые соответствуют K ID во втором кадре данных. Итак ...
У меня есть фрейм данных, в котором есть список Id lists 1 5,2,3 2 2,3,4 Я хотел удалить элемент из списка, который совпадает с другим столбцом Id lists 1 5,2,3 2 3,4
Я пытаюсь заменить список значений в одном столбце другим столбцом, ниже приведены данные и сценарий, которые я использую old = [[51, 1], [52, 1], [53, -1], [], [54 , 0] ...
У меня есть датафрейм, в котором есть столбец «статус», я пытаюсь удалить все строки, в которых столбцы «статус» содержит значение «Нет». Я сделал это так: oppty_oppline.dropna (subset = ['status']) Но "...
Я новичок в программировании Scala / Spark, и мне нужно сохранить DataFrame в виде файла XML, я получаю DataFrame из запроса HQL (Hive). Это простой DataFrame (без массивов или другого сложного типа), я уже ...
Я пытаюсь создать большой случайный набор данных искры. По сути, я хочу начать с 2018-12-01 09:00:00, и для каждой новой строки отметка времени будет меняться на scala.util.Random.nextInt (3) секунды (...
У меня есть объект data.frame, состоящий из столбцов информации в виде дерева. Например, я выполнил поиск набора функций (query_name) и возвратил набор потенциальных совпадений (...
У меня есть данные о преступности из Сан-Франциско. Мои исходные данные выглядят так. Данные из Сан-Франциско Короче говоря, мне нужно построить график зависимости времени от времени (после некоторой фильтрации) и создать ...
Ситуация такова, что я хочу дать пользователю возможность отфильтровывать данные из кадра данных. Прогамматически я могу сделать это нормально, как это. val filter = col ("SomeColA") > 0,1 & amp; Col (»...
Попытка захватить несколько лет ежедневно обновляемых 2-D таблиц. Я могу скачать их в словарь данных. Попытка записать его в файл CSV, поэтому мне не нужно загружать его каждый раз. Импортировать ...
У меня есть этот конкретный кадр данных, и я хотел бы провести некоторые манипуляции с этим. По сути, я хочу разбить значения так, чтобы каждая запись в столбце зарплаты перемещалась вверх, чтобы заменить ранее ...
В приведенном ниже коде я пытался предсказать вероятность диабета. В разделе, в котором я хочу вычислить процент истинного ложного во фрейме данных, и код для этой обязанности выглядит следующим образом ...
Вот часть кода, с которой у меня возникают проблемы: для диапазона х (len (df ['Days'])): if df ['Days'] [x] > 0 и df ['Days'] [x] < = 30: b = df ['Days'] [x] b Результат, который я получаю: b = 14 ...
У меня есть набор файлов (25 файлов) в каталоге. Мне нужно загрузить все файлы данных в один DataFrame, не теряя ссылки на имя файла. Файловая структура (df): дата Var1 Var2 Var3 ...
У меня есть две колонки, скажем, A и B: A B A12 A14 A13 A22 B54 A43 B43 B52 A43 B52 A43 B53 и так далее. Когда я пытаюсь изменить A, записи в B остаются прежними, они не меняются ...
У меня есть датафрейм, df, который содержит столбец с именем 'event', в котором есть массив 24x24x40. Я хочу: извлечь этот массив NumPy; сплющить его в вектор 1x23040; добавить эту запись как ...
У меня есть фрейм данных со столбцами ниже: «ТЕРРИТОРИЯ», «ПОЛЕ ИЗУЧЕНИЯ», «ВЫБЕРИТЕ ГОД Т (АКАДЕМИЧЕСКИЙ ГОД = Т-1 ИЛИ Т)», «ЗНАЧЕНИЕ» Я хочу заменить «ГОД», если имя столбца фрейма данных содержит «ВЫБОР» ГОД". ...
У меня есть датафрейм для панд, содержащий 100 миллионов твитов. Я извлек URL-адреса из данных и в настоящее время храню их в виде списка в столбце панд: Dataframe Я хочу провести анализ этих URL-адресов ...
У меня есть фрейм данных, df, например: data = {'A': ['Jason (121439)', 'Molly (194439)', 'Tina (114439)', 'Jake (127859)', 'Amy ( 122579) '],' B ': [' Bob (127439) ',' Mark (136489) ',' Tyler (121443) ...