0
ответов

Простая кросс-табуляция в pandas

Я наткнулся на pandas, и это выглядит идеально для простых вычислений, которые я хотел бы сделать. У меня есть опыт работы с SAS, и я думал, что он заменит proc freq — похоже, он масштабируется до того, что я могу захотеть…
вопрос задан: 30 December 2017 10:17
0
ответов

Слияние двух DataFrames на основе нескольких ключей в пандах

Имеет ли pandas (или другой модуль) какие-либо функции для поддержки объединения (или объединения) двух таблиц на основе нескольких ключей? Например, у меня есть две таблицы (DataFrames) a и b: > > > a A B значение1 1 1 ...
вопрос задан: 26 December 2017 17:08
0
ответов

Подмножество фрейма данных по нескольким логическим условиям строк для удаления

Я хотел бы разделить (отфильтровать) фрейм данных, указав, какие строки не (!) Сохранять в новом фрейме данных . Вот упрощенный образец фрейма данных: данные v1 v2 v3 v4 а в г в а в г г б н п г b ...
вопрос задан: 13 December 2017 13:01
0
ответов

Как кратко написать формулу с множеством переменных из фрейма данных?

Предположим, я иметь переменную ответа и данные, содержащие три ковариаты (в качестве игрушечного примера): y = c (1,4,6) d = data.frame (x1 = c (4, -1,3), x2 = c (3,9,8), x3 = c (4, -4, -2)) Я хочу подобрать линейный .. .
вопрос задан: 6 December 2017 11:41
0
ответов

Добавление нового столбца в существующий DataFrame в пандах Python

У меня есть следующий индексированный DataFrame с именованными столбцами и строками, не являющимися непрерывными числами: a b c d 2 0.671399 0.101208 -0.181532 0.241273 3 0.446172 -0.243316 ...
вопрос задан: 1 December 2017 16:52
0
ответов

Применение функции к группам внутри data.frame в R

Я пытаюсь получить кумулятивную сумму переменной (v) для групп ("a" и " b") внутри фрейма данных. Как я могу получить результат внизу, чьи строки правильно пронумерованы, в столбец cs...
вопрос задан: 30 November 2017 05:41
0
ответов

Эффективно заменить значения из столбца в другой столбец Pandas DataFrame

У меня есть Pandas DataFrame, подобный следующему: col1 col2 col3 1 0,2 0,3 0,3 2 0,2 ​​0,3 0,3 3 0 0,4 0,4 ​​4 0 0 0,3 5 0 0 0 6 0,1 0,4 0,4 ​​Я хочу заменить ...
вопрос задан: 23 November 2017 14:32
0
ответов

Удалите все строки, в которых длина строки больше n

У меня есть фрейм данных m, и я хочу удалить все строки, в которых столбец f_name имеет запись больше 3. Я предполагаю, что могу использовать что-то похожее на m <- m [-grep ("nchar ( m $ f_name)> 3 ", m $ f_name]
вопрос задан: 8 November 2017 21:30
0
ответов

Объединить два списка в R

У меня два списка сначала = список (a = 1, b = 2, с = 3) second = list (a = 2, b = 3, c = 4) Я хочу объединить эти два списка, чтобы конечный продукт был $ a [1] 1 2 $ b [1] 2 3 $ c [1] 3 4 Есть простой ...
вопрос задан: 8 November 2017 19:54
0
ответов

Python Pandas: преобразовать вывод «.value_counts» в фрейм данных

Привет, я хочу получить количество уникальных значений данных. count_values ​​реализует это, однако я хочу использовать его вывод в другом месте. Как я могу преобразовать вывод .count_values ​​в панд ...
вопрос задан: 6 November 2017 11:53
0
ответов

Как преобразовать столбец со строковым типом в форму int во фрейме данных pyspark?

У меня есть датафрейм в pyspark. Некоторые из его числовых столбцов содержат 'nan', поэтому, когда я читаю данные и проверяю схему dataframe, эти столбцы будут иметь тип 'string'. Как я могу измениться ...
вопрос задан: 26 October 2017 13:43
0
ответов

Изменить тип данных столбцов в Pandas

Я хочу преобразовать таблицу, представленную в виде списка списков, в DataFrame Pandas. В качестве чрезвычайно упрощенного примера: a = [['a', '1.2', '4.2'], ['b', '70', '0.03'], ['x', '5', '0'] ] df = pd ....
вопрос задан: 18 October 2017 21:08
0
ответов

Подсчитайте количество нулей в строке и удалите строки, содержащие более n нулей

У меня есть вопрос о подсчете нулей в ряду. У меня есть такой кадр данных: a = c (1,2,3,4,5,6,0,2,5) b = c (0,0,0,2,6,7,0,0,0 ) c = c (0,5,2,7,3,1,0,3,0) d = c (1,2,6,3,8,4,0,4,0) e = c (0 , 4,6,3,8,4,0,6, ...
вопрос задан: 16 October 2017 14:19
0
ответов

Расширение диапазонов, определенных столбцами «от» и «до»

У меня есть фрейм данных, содержащий «имена» президентов США, годы, когда они начинают и заканчивают свой пост, (столбцы «от» и «до» ). Вот пример имени :от до Билл Клинтон 1993 2001...
вопрос задан: 15 October 2017 17:52
0
ответов

Почему мой DataFrame Pandas не отображает новый порядок, используя `sort_values`?

Новичок в Пандах, так что, может быть, мне не хватает большой идеи? У меня есть Pandas DataFrame регистровых транзакций с формой, подобной (500,4): Время datetime64 [нс] Net Total float64 Налог ...
вопрос задан: 8 October 2017 16:44
0
ответов

Нумерация строк в группах в кадре данных

Работа с фреймом данных, подобным следующему: set.seed (100) df <- data.frame (cat = c (rep ("aaa", 5), rep ("bbb", 5), rep ("ccc", 5)), val = runif (15)) df <- df [порядок (df $ cat, df $ val), ...
вопрос задан: 6 October 2017 19:53
0
ответов

Как отсортировать данные кадра по дате

Мне нужно отсортировать данные по кадрам в R. Все даты в форме "дд / мм / гггг". Даты указаны в 3-й колонке. Заголовок столбца V3. Я видел, как сортировать данные по столбцам ...
вопрос задан: 6 October 2017 10:46
0
ответов

Транспонировать фрейм данных

Мне нужно транспонировать большой фрейм данных, поэтому я использовал: df.aree <- t (df.aree) df.aree <- as.data.frame (df.aree) Вот что я получаю: df.aree [c (1: 5), c (1: 5)] 10428 ...
вопрос задан: 27 September 2017 05:59
0
ответов

Заполните фрейм данных значениями из строк выше.

Скажем, у меня есть фрейм данных, подобный этому: ID, ID_2, FIRST, VALUE ----------------------- 'а', 'аа', ИСТИНА, 2 'а', 'аб', ЛОЖЬ, Н/Д 'a', 'ac', ЛОЖЬ, Н/Д 'б', 'аа', ИСТИНА, 5 'b', 'ab', FALSE, NA Таким образом, ЗНАЧЕНИЕ равно ...
вопрос задан: 26 September 2017 11:57
0
ответов

Создайте data.frame, столбец которого является списком

Я знаю, как добавить столбец списка:> df <- data.frame (a = 1: 3) > df $ b <- список (1: 1, 1: 2, 1: 3) > df a b 1 1 1 2 2 1, 2 3 3 1, 2, 3 Это работает, но не работает:> df <- data ....
вопрос задан: 11 September 2017 15:14
0
ответов

Разделить фрейм данных на несколько выходных файлов

У меня большой набор данных (но следующий, например, маленький). Я могу разделить фрейм данных, а затем я хочу вывести в несколько текстовых файлов, соответствующих уровню, используемому для разделения. mydata <- data....
вопрос задан: 5 September 2017 11:02
0
ответов

Переименуйте один именованный столбец в R

Я хочу обновить один столбец фрейма данных, ссылаясь на него, используя исходное имя, возможно ли это? Например, скажем, у меня была таблица «данные» abc 1 2 2 3 2 3 4 1 2, и я хотел обновить ...
вопрос задан: 5 September 2017 08:01
0
ответов

Заменить значения в кадре данных на основе таблицы соответствия

У меня возникли проблемы с заменой значений в кадре данных. Я хотел бы заменить значения на основе отдельной таблицы. Ниже приведен пример того, что я пытаюсь сделать. У меня есть таблица, где каждая строка ...
вопрос задан: 29 August 2017 12:10
0
ответов

Ошибка выдачи слияния панд & ldquo; Буфер имеет неверное число измерений (ожидается 1, получено 2) & rdquo;

Я пытаюсь выполнить слияние панд и получить указанную выше ошибку из заголовка, когда пытаюсь его запустить. Я использую 3 столбца для сопоставления, тогда как непосредственно перед тем, как сделать подобное слияние только на 2 столбцах, и это работает ..
вопрос задан: 25 August 2017 01:10
0
ответов

Создать порядковый номер (счетчик )для строк в каждой группе кадра данных [дублировать]

Как мы можем генерировать уникальные идентификационные номера в каждой группе фрейма данных? Вот некоторые данные, сгруппированные по "personid" :измерению даты personid. 1 х 23 1 х 32 2 года 21 3...
вопрос задан: 21 August 2017 15:15
0
ответов

Python панды: как убрать значения nan и -inf

У меня есть следующее время данных X Y X_t0 X_tp0 X_t1 X_tp1 X_t2 X_tp2 0 0,002876 0 10 0 NaN NaN NaN NaN NaN 1 0 ....
вопрос задан: 17 August 2017 21:32
0
ответов

Транспонирование в Пандах

Я пытаюсь перенести в панд. У меня есть что-то похожее на это: A B C D E F G H I 1 2 3 4 5 6 7 8 9 Я хочу, чтобы это выглядело так: A 1 B 2 C 3 D 4 E 5 F 6 G 7 H 8 I 9
вопрос задан: 7 August 2017 20:14
0
ответов

Фильтровать кадр данных по максимальным значениям в каждой группе [дубликаты]

У меня есть кадр данных размером 180 000 x 400, где строки соответствуют пользователям, но у каждого пользователя есть ровно две строки. дата идентификации ... 1 2012 ... 3 2010 ... 2 2013 ... 2 2014 ... 1 2011 ...
вопрос задан: 28 July 2017 17:01
0
ответов

Объединить неравные фреймы данных и заменить отсутствующие строки на 0

У меня есть два data.frames, один только с символами, а другой с символами и ценности. df1 = data.frame (x = c ('a', 'b', 'c', 'd', 'e')) df2 = data.frame (x = c ('a', 'b', 'c'), y = c (0,1,0)) merge (...
вопрос задан: 20 July 2017 19:28
0
ответов

Сгруппировать идентификаторы столбцов в панде

Сейчас есть много похожих вопросов, но большинство из них отвечают, как удалить дублирующиеся столбцы. Тем не менее, я хочу знать, как я могу составить список кортежей, где каждый кортеж содержит имена столбцов ...
вопрос задан: 9 July 2017 19:45