dataframe - список вопросов по программированию dataframe

4

ответа

Определите и примените пользовательские ячейки на фрейме данных

Используя python, я создал следующий фрейм данных, который содержит значения подобия: cosinFcolor cosinEdge cosinTexture histoFcolor histoEdge histoTexture jaccard 1 0.770 0.489 0 ....

r dataframe binning summarize

вопрос задан: 17 September 2018 03:15

4

ответа

PANDAS: Объединение фреймов данных с идентификаторами

У меня есть два dataframes, df1 и df2, каждый из которых содержит различную информацию и разной длины, но с общим столбцом «DAY», хотя и не всегда с одинаковым значением. Для контекста одна информация ...

python pandas dataframe merge

вопрос задан: 13 July 2018 11:50

4

ответа

Быстрое чтение очень больших таблиц как данных

У меня есть очень большие таблицы (30 миллионов строк), которые я хотел бы загрузить в виде фреймов данных в R. read.table () имеет много удобных функций, но кажется, что в ...

r-faq dataframe import r

вопрос задан: 3 June 2018 12:36

4

ответа

Сортировка столбцов по дате строки [дубликат]

У меня есть dataframe, полный дат. Используя dfdate.iloc [6], он вернется ниже. 6 2011-01-01 04:31:18 2011-01-01 00:12:54 2011-01-01 04:30:22 2011-01-01 04:15:28 2011-01-01 01:54: 00 ...

python pandas sorting dataframe

вопрос задан: 10 September 2016 19:17

4

ответа

как преобразовать pandas DataFrame в вложенный dict [duplicate]

Я хочу превратить DataFrame во вложенный словарь. Это примерный кадр данных: c1_id c1_des c2_id c2_des c3_id c3_des 000A 0001 A11 0111 A111 111 000A 0001 A11 ...

python pandas dictionary dataframe

вопрос задан: 7 June 2016 06:53

4

ответа

Условная кумулятивная сумма: сброс счетчика - R [дубликат]

У меня есть dataframe: test & lt; - data.frame (seq (as.POSIXct ("12-31-1999 12:15:00", format = "% m-% d-% Y% H:% M:% S "), as.POSIXct (" 12-31-2000 12:15:00 ", format ="% m-% d-% Y% H:% M:% S "), на =" 15 минут ") ) ...

r dataframe cumsum

вопрос задан: 30 December 2015 15:41

4

ответа

сохраняя ключ соединения в качестве первого столбца объединенного блока данных [duplicate]

предоставил этот список dataframe [услуга продажи счета 0 85 8990,0 Pancard 1 15715 1427814.0 Мобильный 2 468 1207252.0 RBLMR 3 6394 1582422,0 DTH, счет продажи ...

python dataframe merge

вопрос задан: 13 November 2015 01:24

4

ответа

Как преобразовать столбец кадра данных в числовой тип?

Как Вы преобразовываете столбец кадра данных в числовой тип?

dataframe r type-conversion

вопрос задан: 9 October 2015 19:54

4

ответа

Как использовать методы объектов в каждой строке фрейма искры в scala [duplicate]

Я создал RDD с тремя столбцами, классы которых - WrappedArray, SparseVector и DenseVector соответственно. Однако, когда я хочу вызывать методы любого объекта SparseVector, этот объект ...

scala apache-spark dataframe apache-spark-sql

вопрос задан: 8 October 2015 11:36

4

ответа

Как удалить вложенный массив из другого массива из DataFrame, прочитанного в JSON? [Дубликат]

Я новичок в Scala и Spark. У меня вопрос о том, как удалить вложенный массив из моего DataFrame. Это моя схема DataFrame: root | - dedupeMode: string (nullable = true) | - modules: array (...

json scala apache-spark dataframe nested

вопрос задан: 25 September 2015 23:39

4

ответа

определяя, содержит ли DataFrame определенные ключевые слова строки и получает свое местоположение [дубликат]

В принципе, предположим, что мы получаем вход для: «Crayola Blue Short Crayons». Я хочу, чтобы программа проходила через csv-файл и находила первую / лучшую ячейку, которая соответствует строке. Так, например, это ...

python pandas dataframe

вопрос задан: 16 January 2015 00:54

4

ответа

Dataframe из массива numpy без данных, становящихся индексом [duplicate]

У меня есть массив, созданный из dataframe с использованием .value_counts (), который появляется как 7 600 6 522 8 358 1 336 5 323 11 319 4 316 10 299 12 294 9 278 3 233 2 232 ...

python arrays pandas numpy dataframe

вопрос задан: 29 September 2014 11:38

4

ответа

извлечение задержки и момент дня из кадра данных pandas [дубликат]

Я получаю pd.Dataframe, я зацикливаюсь на использовании timedelta. Мой dataframe выглядит так: pickup_date dropoff_date 2009-01-01 11:04:24 2009-01-01 11:14:33 2009-01-01 11:21:20 2009-01-02 11:31:21 ... ,

python pandas dataframe time-series

вопрос задан: 2 March 2014 22:00

4

ответа

Как преобразовать определенный столбец в Процент с знаком% [дубликат]

У меня ниже указанного кадра данных: ID Perc_1 Значение Perc_2 Value2 Perc_3 Значение_3 KA-127 0.25334 250 0.33458 187 0.42889 258 KA-128 0.29314 140 0.39498 210 ...

r dataframe dplyr

вопрос задан: 5 September 2013 09:53

4

ответа

Как подсчитать внешний вид в кадре данных панды альтернативным способом [дублировать]

Я хочу эффективно оценивать внешний вид в рамке данных панд. Вот мои данные, а это имя dataframe No Customer_id 1 678 2 678 3 679 Вот что я хочу Нет ...

python pandas dataframe

вопрос задан: 1 August 2013 14:11

4

ответа

как добавить pd.groupby (). size () в data.frame? [Дубликат]

Я изучаю ML на kaggle (проект Titanic). У меня проблема с написанием кода для добавления новых функций! import pandas as pd import numpy как np data = pd.read_csv ('train.csv') print (data.drop (['Name ",' Sex ', ...

python pandas dataframe

вопрос задан: 1 August 2013 14:11

4

ответа

Функция python .T преобразует значения в научную нотацию [duplicate]

Все еще привыкший к пандам, я вижу, что я вижу, когда я трансформирую группу по выражению, глядя на то, что значения превращаются в научную нотацию, тогда как когда это не так, значения находятся в ...

pandas dataframe transform

вопрос задан: 19 July 2013 03:43

4

ответа

Несколько операций группировки столбцов данных (дубликаты)

import pandas as pd import numpy как np df = pd.DataFrame (np.random.randint (0,10, size = (10, 3)), columns = ['price', 'created_year', 'price_per_cm'], index = диапазон (1,11)) ...

python python-3.x pandas dataframe pandas-groupby

вопрос задан: 25 January 2013 22:26

4

ответа

Получение значений в матрице с именами строк и столбцов, хранящимися в dataframe [duplicate]

Предположим, что у меня есть матрица rmatrix, определенная ниже: set.seed (10) rmatrix & lt; - matrix (sample (0: 100, 16), ncol = 4) dimnames (rmatrix) & lt; - list (rownames (rmatrix, do.NULL = FALSE, prefix = "row"), ...

r dataframe matrix

вопрос задан: 29 November 2012 10:54

4

ответа

Выполнение расчетов по списку выбранных столбцов [дубликат]

Для этого упражнения у меня есть dataframe, содержащий номера заказов, идентификаторы предметов, идентификаторы компаний, страны и счет. На практике у меня много столбцов. Теперь я хочу автоматизировать некоторые вычисления для анализа ...

python pandas dataframe

вопрос задан: 6 November 2012 20:17

4

ответа

Как добавить datarow из df в другую верхнюю строку df [duplicate]

У меня два df df1, количество ключей один 2 два 3 df2, количество ключей четыре 5 пять 6 Я попытался добавить, но добавляет в конце, мой желаемый результат должен быть, df, количество ключей один 2 два 3 четыре 5 ...

python pandas dataframe data-analysis datarow

вопрос задан: 12 October 2012 00:53

4

ответа

R: совокупные столбцы data.frame

У меня есть data.frame, который похож на это> голова (df) Память Памяти Памяти Памяти Памяти, Наивная Наивный 10472501 6.075714 5.898929 6.644946 6.023901 6.332126 8....

r dataframe

вопрос задан: 27 July 2010 22:26

4

ответа

Существует ли краткий синтаксис для выполнения блока n времена в Scala?

Я нахожу меня написанием кода как это, когда я хочу повторить некоторое выполнение n времена: для (я <-1 к n) {doSomething ()} я ищу более короткий синтаксис как это: n.times (doSomething ()) Делает...

dataframe

вопрос задан: 16 May 2010 04:40

4

ответа

преобразование нескольких строк текста в кадр данных

Я пытаюсь найти способ преобразовать несколько строк текста в кадр данных. Я не уверен, существует ли путь, где можно использовать read.delim (), чтобы читать в нескольких строках текста и создать следующее...

r dataframe

вопрос задан: 6 March 2010 04:31

3

ответа

Как получить доступ к последнему значению в векторе?

Предположим, что у меня есть вектор, который вкладывается в кадре данных один или два уровня. Существует ли быстрый и грязный способ получить доступ к последнему значению, не используя длину () функция? Что-то $ Perl крыла # особенный...

r dataframe vector

вопрос задан: 28 April 2019 17:29

3

ответа

Как объединить (объединить) фреймы данных (внутренний, внешний, левый, правый)

Имеются два фрейма данных: df1 = data.frame (CustomerId = c (1: 6), Product = c (rep («Тостер», 3), rep («Radio», 3))) df2 = data.frame (CustomerId = c (2, 4, 6), штат = c (rep ("Алабама", 2), rep ("Огайо", 1))) ...

r-faq merge join r dataframe

вопрос задан: 29 March 2019 17:14

3

ответа

Я хочу преобразовать строку в столбец

Я хочу преобразовать некоторое значение строки в столбец, если они существуют несколько раз в зависимости от конкретного идентификатора. У меня есть один df, в котором есть столбец, такой как идентификатор и номер телефона. Я хочу сделать номер телефона д

python pandas dataframe

вопрос задан: 28 March 2019 13:38

3

ответа

Панды фильтруют строки по условию, но всегда сохраняют первую строку

Я хотел бы удалить некоторые строки, которые соответствуют определенным условиям, но я не хочу удалять первую строку, даже если первая строка соответствует этим критериям. Я пытался сбросить строки с помощью функции df.drop, но ...

python pandas dataframe

вопрос задан: 28 March 2019 01:26

3

ответа

Создание фрейма данных на основе условий других фреймов

У меня есть два кадра данных: столбец s-1, столбцы d-3 s = {0: [0, 0.3, 0.5, -0.1, -0.2, 0.7, 0]} d = {0: [0.1, 0.2, -0.2, 0, 0, 0, 0], 1: [0,3, 0,4, -0,7, 0, 0,8, 0, 0,1], 2: [-0,5, 0,4, -0,1, 0,5, 0,5, 0, ...

python pandas numpy dataframe

вопрос задан: 22 March 2019 15:44

3

ответа

Невидимые факторные уровни при добавлении новых записей с невидимой строкой оценивают кадру данных, Предупреждению причины и результату в NA

У меня есть кадр данных (14.5K строки на 15 столбцов) содержащий тарификацию данных с 2001 до 2007. Я добавляю новые данные 2008 года к нему с: небывалый <-rbind (небывалый, all2008), К сожалению, который генерирует...

r dataframe append r-factor

вопрос задан: 22 March 2019 09:04