Мне нужно проверить, содержатся ли элементы из «a» в «b» и сохранить в другом векторе другие элементы. В R я делаю следующее: a & lt; - df $ v1 b & lt; - df2 $ v1 c & lt; - a [! (A% in% b)] ...
Я только начал изучать Spark и Python и застрял. Я тестировал воды с набором данных MovieLens 1M, но застрял в соединении с dataframe и не мог понять, в чем проблема. Кажется ...
У меня есть DataSet с несколькими столбцами, и один раз из столбцов имеет уникальные идентификационные значения, определяющие, какая строка принадлежит UID. UID может находиться в пределах 1 - 10000. Как разрезать этот DF на ...
У меня есть 2 столбца в df: Name и Year, и я хочу их конкатенировать. В соответствии с этим ответом наилучшим решением (и самым быстрым в моем опыте) является: df [['Year', 'quarter']]. Astype (str) ....
У меня есть два кадра данных, содержащих информацию следующим образом: & gt; df1: X1 X2 Adele Soul Cher Pop Sting Rock Beyonce R & amp; B и & gt; df2: имя completeName B Beyonce A ...
Я ищу решение, которое может создать новую фреймворку данных, если на месте расположения данных есть наличие объекта списка. Если это список, чем добавлять только те элементы в разных строках, не затрагивая ...
Первый параграф времени, извините, если это раздражает. Имея трудное время, чтобы понять, как определить динамически меняющуюся переменную в цикле ... например, это внутри цикла for, i = 1 для x в [...
У меня есть список: list1 = ['brand1', 'brand2'] Я хочу создать тактику данных, чтобы: import pandas как pd для i в списке1: "df_" + i = pd.read_csv ('filepath' + i) Я хочу создать dataframe как: ...
У меня есть pandas DataFrame, который выглядит так: Col1 Col2 0 Код1 1 B code1 2 C code2 3 Код1 Я хочу добавить столбец в DataFrame для каждого уникального значения кода в Col 2 и ...
Я подмножаю dataframe, dfSub в r на основе уровней фактора dfSub $ event_id, чтобы создать новый dataframe, dfLeftRight. Однако новый dataframe, похоже, сохраняет значения, которые я остановил. Для ...
вот моя проблема: у меня есть таблица с 3 столбцами и 12 raws, которая выглядит так: когда я выполняю: data $ exp, я получаю: h h h h h U U U U U U U Уровни: h U (что я ожидаю). Но когда я исполняю ...
Как физически растянуть график ниже как по горизонтали, так и по вертикали? import pandas import numpy import matplotlib from matplotlib import pyplot% matplotlib inline df = pandas.DataFrame (...
Я использую Pandas Dataframes для анализа данных. Если я просто распечатываю фрейм данных, он никогда не отображает полный фрейм данных. Даже если я выберу меньшую часть кадра данных с помощью .loc (). ...
Мне было интересно, можно ли добавить один столбец одного кадра данных в другой фрейм данных, когда идентификатор в обоих файлах данных соответствует. Так что немного та же идея, что и в базе данных ...
Я знаю, что это очень просто, но я думаю, что не знаю, как правильно это сделать. У меня есть dataframe, как это слово чувство 1 способность положительный 2 способность положительный 3 ...
У меня есть pd.DataFrame, который имеет как пустые значения, так и «N / A, NA, na и т. Д.». значения во всех столбцах (кроме первого столбца). Я указал keep_default_na, поэтому он показывает «N / A», но не ...
как вы подмножите блок данных с несколькими условиями на более чем 1 столбец? например, df = pd.DataFrame ([['1', '2', '3'], ['1', '3', '2'], ['1', '2', '3']] , columns = ['a', 'b', 'c']) output: 'a' 'b' 'c' 1 2 ...
У меня есть dataframe с столбцом столбцов даты и чисел (по одному числу для каждого дня). Я хочу создать новый dataframe, полученный из этого с теми же столбцами (даты индексов), но только с числами ...
Запуск python 3.6, я новичок в python и pandas library. У меня большой размер данных более 10000 строк и 30 столбцов. Среди этих столбцов один из них имеет списки хитов / пропусков, а также ...
Из моего грубого представления двух разных фреймов данных со строками. По сути, я хочу сравнить данные между двумя различными фреймами данных разных размеров. Итак, давайте просто скажем ...
В настоящее время встречается проблема при обработке сравнения между двумя кадрами данных. df1 содержит строки, которые я хотел бы удалить со значением, найденным в df2 df1 = col1: (cat, dog, ...
Входной dataframe val ds = Seq ((1, «Play Framework»), (2, «Искра»), (3, «Spring framework»)). ToDF («is», «subject») Предположим, что мое значение префикса префикс и суффикс - это суффикс. Тогда я ожидаю ...
введите описание изображения здесь. У меня есть данные, которые выглядят следующим образом: я хотел бы объединить округленное время и емкость, соответствующую этому времени. Так, как и в 4-м, у меня будет одна запись из 10 ...
У меня есть кадр данных, который содержит столбец чисел. Я пытаюсь добавить эти числа вместе через функцию mutate, чтобы я мог создать новую переменную, содержащую общую сумму этих ...
Я пытаюсь извлечь только уникальные значения определенного столбца в фрейме данных. Вот пример: df & lt; - data.frame (word1 = c ("not", "but", "not", "not", "never", "nor", "never", "not"), word2 = с (»...