data.table - список вопросов по программированию data.table

0

ответов

R: цикл по столбцам в data.table

Я хочу определить классы столбцов большой data.table. colClasses <- sapply(DT, FUN=function(x)class(x)[1]) работает, но видимо локальные копии хранятся в памяти: > memory.size() [...

data.table r sapply

вопрос задан: 14 May 2012 14:39

0

ответов

Использование пакета data.table внутри моего собственного пакета

Я пытаюсь использовать пакет data.table внутри своего собственного пакета . MWE заключается в следующем: я создаю функцию test.fun, которая просто создает небольшой объект data.table, а затем суммирует столбец "Val"...

data.table r

вопрос задан: 10 May 2012 08:09

0

ответов

Быстрое ограничение данных в R

Предположим, у меня есть длинный вектор vec (, начинающийся с 1E8 элементов ), и я хочу ограничить его диапазоном [а, б]. Я, конечно, могу закодировать vec[vec < a] = a и vec[vec > b] = b, но это...

bigdata data.table performance r rcpp

вопрос задан: 6 May 2012 22:17

0

ответов

использование data.table для пометки первой (или последней )записи в группе

Учитывая ключ сортировки, есть ли ярлык в data.table для дублирования первой и последние функции, обнаруженные в SAS и SPSS? Пешеходный подход ниже отмечает первую запись группы. Учитывая...

data.table r

вопрос задан: 6 May 2012 21:30

0

ответов

Преобразование числовой матрицы в data.table (или data.frame)

Надеюсь, что здесь есть простой ответ, но я нигде не могу его найти. У меня есть числовая матрица с помеченными строками и столбцами: 1 2 3 4 а 6 7 8 9 б 8 7 5 7 c 8 ...

data.table dataframe r reshape transformation

вопрос задан: 20 April 2012 09:13

0

ответов

Повышение производительности обновления содержимого большого фрейма данных с использованием содержимого аналогичного фрейма данных

Я ищу общее решение для обновления одного большого фрейма данных содержимым второго аналогичного фрейма данных. У меня есть десятки наборов данных, каждый с тысячами строк и более 10 000...

data.table dataframe r

вопрос задан: 13 April 2012 16:59

0

ответов

Как подмножить отрицание значения ключа с помощью пакета R's data.table?

Пакет R data.table предлагает быстрое подмножество значений на основе ключей. Так, например, :set.seed(1342)df1 <-data.table(group = gl(10, 10, labels = letter[1:10]), value =...

data.table r

вопрос задан: 10 April 2012 10:58

0

ответов

Преобразование соединений SQL по внешним ключам в синтаксис R data.table

Пакет data.table предоставляет многие из тех же методов обработки таблиц, что и SQL. ключ, этот ключ состоит из одного или нескольких столбцов. Но таблица не может иметь более одного ключа, потому что она может "...

data.table r sql

вопрос задан: 29 March 2012 10:12

0

ответов

объединить соответствующие столбцы в data.frame или data.table

У меня есть следующие data.frames: a <- data.frame(id = 1:3, v1 = c('a', NA, NA), v2 = c(NA, 'b', 'c')) b <- data.frame(id = 1:3, v1 = c(NA, 'B', 'C'), v2 = c("A", NA, NA)) > идентификатор v1 v2 ...

data.table dataframe plyr r merge

вопрос задан: 29 March 2012 03:30

0

ответов

Получить столбцы по строке из data.table [дубликат]

raw — это data.table, и работает следующий код:raw[,r_responseTime] #Возвращает весь столбец raw[,c_filesetSize] #То же, что и выше, возвращает столбец plot(raw[,r_responseTime]~raw[,c_filesetSize])#...

data.table r

вопрос задан: 26 March 2012 11:00

0

ответов

«Прокручивать» data.table для вычисления условных средних значений

Я хочу «перебирать» строки таблицы data.table и вычислять среднее значение для каждой строки. Среднее значение следует рассчитывать на основе следующего механизма: Найдите идентификатор идентификатора в строке i (ID(i)) ...

data.table r

вопрос задан: 23 March 2012 17:35

0

ответов

Агрегирование промежуточных и общих итогов с помощью data.table

У меня есть таблица data.table в R: library (data.table) set.seed (1) DT = data.table (group = sample (letter [1: 2], 100, replace = TRUE), year = sample (2010: 2012,100, replace = TRUE), v = runif (100)) Агрегирование ...

r aggregate plyr data.table

вопрос задан: 16 February 2012 20:08

0

ответов

R xts и data.table

Я могу преобразовать data.table в объект xts так же, как и с data.frame:> df = data.frame (x = c ("a", "b "," c "," d "), v = rnorm (4)) > dt = data.table (x = c ("a", "b", "c", "d"), v = rnorm (4)) ...

r xts data.table

вопрос задан: 15 February 2012 14:30

0

ответов

Использование plyr, doMC и summarise() с очень большим набором данных?

У меня есть довольно большой набор данных (~1,4 млн строк), который я немного разбиваю и суммирую. Все это занимает некоторое время, а мое конечное приложение зависит от частого выполнения, поэтому я подумал ...

r plyr data.table

вопрос задан: 3 January 2012 12:55

0

ответов

Большое слияние / управление памятью

Я уперся в стену, пытаясь слиться файл большого размера и файл поменьше. Я прочитал много других сообщений об управлении памятью в R и не смог найти неэкстремальный (перейти на 64-битную версию, загрузить в кластер, ...

r memory-management merge data.table

вопрос задан: 22 December 2011 09:21

0

ответов

Как выбрать строки по двум критериям в data.table в R

Допустим, у меня есть data.table, и я хочу выбрать все строки, в которых переменная x имеет значение b. Это простая библиотека (data.table) DT <- data.table (x = rep (c ("a", "b", "c"), each = 3), y = c (1,3,6), v = ...

r select subset data.table

вопрос задан: 14 December 2011 18:16

0

ответов

Я использую plyr, верно? Кажется, я использую слишком много памяти

У меня есть следующий, довольно большой набор данных:> dim (dset) [1] 422105 25> class (dset) [1] "data.frame"> Ничего не делая, Процесс R, похоже, занимает около 1 ГБ ОЗУ. Я ...

r plyr data.table

вопрос задан: 13 December 2011 14:17

0

ответов

Прокрутите столбцы в таблице data.table и преобразовать эти столбцы

У меня есть таблица data.table DT со столбцом с именем RF и многими столбцами с подчеркиванием _ в нем.Я хочу перебрать все эти столбцы с подчеркиванием и вычесть из него столбец RF. Однако я ...

r data.table

вопрос задан: 4 December 2011 11:07

0

ответов

Эффективен ли мой способ дублирования строк в data.table?

У меня есть ежемесячные данные в одной data.table и годовые данные в другой data.table, и теперь я хочу сопоставить годовые данные с соответствующим наблюдением в ежемесячные данные. Мой подход заключается в следующем: ...

r data.table

вопрос задан: 4 November 2011 13:28

0

ответов

Как я могу извлечь значения из data.frame на основе вектора в R?

предположим, что у меня есть числовой вектор, например: x <- c (1.0, 2.5, 3.0) и data.frame: df <- data.frame (key = c (0.5,1.0,1.5,2.0,2.5,3.0), value = c (-1.187,0.095, -0.142, -0.818, -0.734,0.511)) ключ df ...

r hash dataframe data.table

вопрос задан: 1 November 2011 01:39

0

ответов

Разделение таблицы data.table с помощью оператора: функции, возвращающие числовые значения и / или NA fail

У меня есть таблица data.table с двумя столбцами: один столбец идентификатора и один столбец значений. Я хочу разбить таблицу по столбцу идентификатора и запустить функцию foo в столбце значения. Это прекрасно работает, пока foo делает ...

r data.table

вопрос задан: 31 October 2011 23:01

0

ответов

Как можно быстро агрегировать и обобщать данные?

У меня есть набор данных, заголовки которого выглядят следующим образом: PID Time Site Rep Count Я хочу суммировать счетчик по Rep для каждой комбинации PID x Time x Site в результирующих данных. кадра, я хочу получить среднее значение Count ...

r plyr data.table

вопрос задан: 26 October 2011 14:24

0

ответов

Преобразование классов столбцов в data.table

У меня проблема с использованием data.table: Как преобразовать классы столбцов? Вот простой пример: с data.frame у меня нет проблем с его преобразованием, с data.table я просто не знаю как: df <- ...

r data.table

вопрос задан: 19 October 2011 21:16

0

ответов

Почему «уникальный» выполняется быстрее в кадре данных, чем матрица в R?

Я начал верить, что кадры данных не имеют преимуществ над матрицами, за исключением удобства записи. Однако я заметил эту странность при запуске unique на матрицах и фреймах данных: кажется ...

performance r matrix dataframe data.table

вопрос задан: 18 October 2011 18:34

0

ответов

Извлечение уникальных строк из таблицы данных в R [дубликат]

Я переход от фреймов данных и матриц к таблицам данных, но не нашел решения для извлечения уникальных строк из таблицы данных. Полагаю, что-то мне не хватает в [, J] ...

r data.table

вопрос задан: 26 September 2011 22:52

0

ответов

Правильный / самый быстрый способ изменить форму data.table

У меня есть таблица данных в R: library (data.table) набор. семена (1234) DT <- data.table (x = rep (c (1,2,3), each = 4), y = c («A», «B»), v = sample (1: 100,12)) DT xyv [1,] 1 A 12 [2,] 1 B 62 [3,] 1 A 60 [4,] ...

r data.table

вопрос задан: 2 August 2011 13:52

0

ответов

Самый быстрый способ подмножества - таблица данных по сравнению с MySQL

Я пользователь R и часто обнаруживаю, что мне нужно писать функции, которые требуют подмножества больших наборов данных (десятки миллионов ряды). Когда я применяю такие функции к большому количеству наблюдений, ...

mysql r rmysql data.table

вопрос задан: 6 July 2011 01:30

0

ответов

подмножество в data.table

Я пытаюсь выделить подмножество data.table (из пакет data.table) в R (не data.frame). Я использую 4-значный год в качестве ключа. Я хотел бы выделить несколько лет. Например, я хочу ...

r subset data.table

вопрос задан: 31 March 2011 17:12

0

ответов

data.table и символьные векторы

В моей работе Я часто называю списки переменных одним вектором символов. A <- data.table (var1 = 1:10, var2 = 11:20, var3 = 21:30) vecvar <- c ("var1", "var2", "var3") По возможности, я ...

r data.table

вопрос задан: 26 March 2011 07:15