25
ответов

Python: выбор различных элементов пересечения множеств [duplicate]

Мне нужно проверить, содержатся ли элементы из «a» в «b» и сохранить в другом векторе другие элементы. В R я делаю следующее: a & lt; - df $ v1 b & lt; - df2 $ v1 c & lt; - a [! (A% in% b)] ...
вопрос задан: 29 April 2017 13:12
20
ответов

Ошибка записи данных в формате PySpark (данные MovieLens) [дубликат]

Я только начал изучать Spark и Python и застрял. Я тестировал воды с набором данных MovieLens 1M, но застрял в соединении с dataframe и не мог понять, в чем проблема. Кажется ...
вопрос задан: 22 March 2016 14:59
16
ответов

как разрезать DataFrame на три набора данных на значение столбца [duplicate]

У меня есть DataSet с несколькими столбцами, и один раз из столбцов имеет уникальные идентификационные значения, определяющие, какая строка принадлежит UID. UID может находиться в пределах 1 - 10000. Как разрезать этот DF на ...
вопрос задан: 10 June 2014 18:24
15
ответов

Pandas .astype (str) .sum () с разделителем [duplicate]

У меня есть 2 столбца в df: Name и Year, и я хочу их конкатенировать. В соответствии с этим ответом наилучшим решением (и самым быстрым в моем опыте) является: df [['Year', 'quarter']]. Astype (str) ....
вопрос задан: 26 November 2017 20:36
15
ответов

Согласование данных в соответствии с порядком столбца [дубликат]

У меня есть два кадра данных, содержащих информацию следующим образом: & gt; df1: X1 X2 Adele Soul Cher Pop Sting Rock Beyonce R & amp; B и & gt; df2: имя completeName B Beyonce A ...
вопрос задан: 22 March 2017 17:14
14
ответов

Значения в Dataframe для сравнения строк, если это список [duplicate]

Я ищу решение, которое может создать новую фреймворку данных, если на месте расположения данных есть наличие объекта списка. Если это список, чем добавлять только те элементы в разных строках, не затрагивая ...
вопрос задан: 10 September 2017 17:21
14
ответов

как определить переменную, которая назначает динамический dataframe [duplicate]

Первый параграф времени, извините, если это раздражает. Имея трудное время, чтобы понять, как определить динамически меняющуюся переменную в цикле ... например, это внутри цикла for, i = 1 для x в [...
вопрос задан: 22 March 2017 17:21
13
ответов

Как создать dataframes из списка строк, а затем объединить в единый файл данных без использования словаря? [Дубликат]

У меня есть список: list1 = ['brand1', 'brand2'] Я хочу создать тактику данных, чтобы: import pandas как pd для i в списке1: "df_" + i = pd.read_csv ('filepath' + i) Я хочу создать dataframe как: ...
вопрос задан: 22 March 2017 17:21
13
ответов

Невозможно отфильтровать data.frame по нескольким столбцам в R [duplicate]

У меня есть следующий data.frame в R: значение даты позиции 1 1 2017-01-01 100 2 1 2017-01-02 115 3 2 2017-01-01 200 4 2 2017-01-03 150 Я хочу .. ,
вопрос задан: 22 March 2017 17:14
13
ответов

используя pandas apply () для создания новых столбцов на основе условия [duplicate]

У меня есть pandas DataFrame, который выглядит так: Col1 Col2 0 Код1 1 B code1 2 C code2 3 Код1 Я хочу добавить столбец в DataFrame для каждого уникального значения кода в Col 2 и ...
вопрос задан: 19 May 2016 07:50
12
ответов

подмножество кадра данных в r, не оставляя правильных значений [duplicate]

Я подмножаю dataframe, dfSub в r на основе уровней фактора dfSub $ event_id, чтобы создать новый dataframe, dfLeftRight. Однако новый dataframe, похоже, сохраняет значения, которые я остановил. Для ...
вопрос задан: 27 May 2015 11:17
12
ответов

Ошибки в уровнях подтаблицы в R [дубликат]

вот моя проблема: у меня есть таблица с 3 столбцами и 12 raws, которая выглядит так: когда я выполняю: data $ exp, я получаю: h h h h h U U U U U U U Уровни: h U (что я ожидаю). Но когда я исполняю ...
вопрос задан: 27 May 2015 11:17
12
ответов

Растянуть участок горизонтально и вертикально с помощью matplotlib? [Дубликат]

Как физически растянуть график ниже как по горизонтали, так и по вертикали? import pandas import numpy import matplotlib from matplotlib import pyplot% matplotlib inline df = pandas.DataFrame (...
вопрос задан: 1 December 2008 22:24
11
ответов

Когда я печатаю кадр данных Pandas, он всегда минимизируется [дублировать]

Я использую Pandas Dataframes для анализа данных. Если я просто распечатываю фрейм данных, он никогда не отображает полный фрейм данных. Даже если я выберу меньшую часть кадра данных с помощью .loc (). ...
вопрос задан: 23 March 2018 17:52
11
ответов

Как добавить один столбец данных в другой фрейм данных, когда идентификатор доступен в обоих кадрах данных? [Дубликат]

Мне было интересно, можно ли добавить один столбец одного кадра данных в другой фрейм данных, когда идентификатор в обоих файлах данных соответствует. Так что немного та же идея, что и в базе данных ...
вопрос задан: 22 March 2017 17:14
11
ответов

Считайте вхождения группы в R-кадров данных [дубликат]

Я знаю, что это очень просто, но я думаю, что не знаю, как правильно это сделать. У меня есть dataframe, как это слово чувство 1 способность положительный 2 способность положительный 3 ...
вопрос задан: 29 January 2017 11:58
11
ответов

Как выбрать значение столбца на основе другого значения столбца в пандах? [Дубликат]

У меня есть dataframe следующим образом: ABCD --------------- 1 a 0 1 2 4 0 3 3 a 0 4 4 a 4 5 5 t 3 9 Я хотел бы получить столбец C ...
вопрос задан: 17 April 2016 21:49
11
ответов

Подсчет & ldquo; N / A & rdquo; значения (не NaN) в рамке данных pandas через несколько столбцов (Python 3.6) [duplicate]

У меня есть pd.DataFrame, который имеет как пустые значения, так и «N / A, NA, na и т. Д.». значения во всех столбцах (кроме первого столбца). Я указал keep_default_na, поэтому он показывает «N / A», но не ...
вопрос задан: 17 April 2016 21:49
11
ответов

подмножество данных с несколькими условиями - python [duplicate]

как вы подмножите блок данных с несколькими условиями на более чем 1 столбец? например, df = pd.DataFrame ([['1', '2', '3'], ['1', '3', '2'], ['1', '2', '3']] , columns = ['a', 'b', 'c']) output: 'a' 'b' 'c' 1 2 ...
вопрос задан: 17 April 2016 21:49
11
ответов

pandas dataframes получает все строки, которые попадают между двумя датами [duplicate]

import pandas as pd из pandas.io.html import read_html из datetime import datetime import time wiki_fires = pd.read_html ("https://en.wikipedia.org/wiki/2017_California_wildfires") wildfire_df = ...
вопрос задан: 17 April 2016 21:49
11
ответов

Python использует переменную & ldquo; вчера & rdquo; для выбора только определенных строк dataframe [duplicate]

(вчера) = вчера (0). (0% str Создать фрейм данных ...
вопрос задан: 17 April 2016 21:49
11
ответов

простая задача - pandas - df2 с числами от df1 больше, чем & hellip; [Дубликат]

У меня есть dataframe с столбцом столбцов даты и чисел (по одному числу для каждого дня). Я хочу создать новый dataframe, полученный из этого с теми же столбцами (даты индексов), но только с числами ...
вопрос задан: 17 April 2016 21:49
11
ответов

Создание нового фреймворка с определенным условием из значения оригинального фреймворка [duplicate]

Запуск python 3.6, я новичок в python и pandas library. У меня большой размер данных более 10000 строк и 30 столбцов. Среди этих столбцов один из них имеет списки хитов / пропусков, а также ...
вопрос задан: 17 April 2016 21:49
11
ответов

Сравнивая два разных кадра данных разных размеров с использованием Pandas [duplicate]

Из моего грубого представления двух разных фреймов данных со строками. По сути, я хочу сравнить данные между двумя различными фреймами данных разных размеров. Итак, давайте просто скажем ...
вопрос задан: 6 March 2015 16:30
11
ответов

Искать значение в df1 ('col1') равно любому значению в df2 ('col3') и удалять строку из df1, если True [Python] [duplicate]

В настоящее время встречается проблема при обработке сравнения между двумя кадрами данных. df1 содержит строки, которые я хотел бы удалить со значением, найденным в df2 df1 = col1: (cat, dog, ...
вопрос задан: 6 March 2015 16:30
11
ответов

Получение записей данных данных, которые не существуют во втором фрейме данных [дубликат]

У меня есть два кадра данных с уникальным. На основе сравнения ID я хотел бы получить записи из df1, которых нет в df2. Заранее спасибо!
вопрос задан: 6 March 2015 16:30
10
ответов

Как добавить значения префикса и суффикса для столбца в искровом фрейме с использованием scala [duplicate]

Входной dataframe val ds = Seq ((1, «Play Framework»), (2, «Искра»), (3, «Spring framework»)). ToDF («is», «subject») Предположим, что мое значение префикса префикс и суффикс - это суффикс. Тогда я ожидаю ...
вопрос задан: 17 June 2018 10:01
10
ответов

Может ли кто-нибудь помочь мне очистить и заполнить эти данные? [Дубликат]

введите описание изображения здесь. У меня есть данные, которые выглядят следующим образом: я хотел бы объединить округленное время и емкость, соответствующую этому времени. Так, как и в 4-м, у меня будет одна запись из 10 ...
вопрос задан: 19 October 2015 08:57
10
ответов

Ошибка Mutate при попытке суммирования столбца в фрейме данных [дубликат]

У меня есть кадр данных, который содержит столбец чисел. Я пытаюсь добавить эти числа вместе через функцию mutate, чтобы я мог создать новую переменную, содержащую общую сумму этих ...
вопрос задан: 19 October 2015 08:57
10
ответов

Как извлекать уникальные значения столбцов в кадре данных в R и подсчитывать количество отображаемых [дубликатов]

Я пытаюсь извлечь только уникальные значения определенного столбца в фрейме данных. Вот пример: df & lt; - data.frame (word1 = c ("not", "but", "not", "not", "never", "nor", "never", "not"), word2 = с (»...
вопрос задан: 19 October 2015 08:57