0
ответов

R: цикл по столбцам в data.table

Я хочу определить классы столбцов большой data.table. colClasses <- sapply(DT, FUN=function(x)class(x)[1]) работает, но видимо локальные копии хранятся в памяти: > memory.size() [...
вопрос задан: 14 May 2012 14:39
0
ответов

Использование пакета data.table внутри моего собственного пакета

Я пытаюсь использовать пакет data.table внутри своего собственного пакета . MWE заключается в следующем: я создаю функцию test.fun, которая просто создает небольшой объект data.table, а затем суммирует столбец "Val"...
вопрос задан: 10 May 2012 08:09
0
ответов

Быстрое ограничение данных в R

Предположим, у меня есть длинный вектор vec (, начинающийся с 1E8 элементов ), и я хочу ограничить его диапазоном [а, б]. Я, конечно, могу закодировать vec[vec < a] = a и vec[vec > b] = b, но это...
вопрос задан: 6 May 2012 22:17
0
ответов

использование data.table для пометки первой (или последней )записи в группе

Учитывая ключ сортировки, есть ли ярлык в data.table для дублирования первой и последние функции, обнаруженные в SAS и SPSS? Пешеходный подход ниже отмечает первую запись группы. Учитывая...
вопрос задан: 6 May 2012 21:30
0
ответов

Преобразование числовой матрицы в data.table (или data.frame)

Надеюсь, что здесь есть простой ответ, но я нигде не могу его найти. У меня есть числовая матрица с помеченными строками и столбцами: 1 2 3 4 а 6 7 8 9 б 8 7 5 7 c 8 ...
вопрос задан: 20 April 2012 09:13
0
ответов

Повышение производительности обновления содержимого большого фрейма данных с использованием содержимого аналогичного фрейма данных

Я ищу общее решение для обновления одного большого фрейма данных содержимым второго аналогичного фрейма данных. У меня есть десятки наборов данных, каждый с тысячами строк и более 10 000...
вопрос задан: 13 April 2012 16:59
0
ответов

Как подмножить отрицание значения ключа с помощью пакета R's data.table?

Пакет R data.table предлагает быстрое подмножество значений на основе ключей. Так, например, :set.seed(1342)df1 <-data.table(group = gl(10, 10, labels = letter[1:10]), value =...
вопрос задан: 10 April 2012 10:58
0
ответов

Преобразование соединений SQL по внешним ключам в синтаксис R data.table

Пакет data.table предоставляет многие из тех же методов обработки таблиц, что и SQL. ключ, этот ключ состоит из одного или нескольких столбцов. Но таблица не может иметь более одного ключа, потому что она может "...
вопрос задан: 29 March 2012 10:12
0
ответов

объединить соответствующие столбцы в data.frame или data.table

У меня есть следующие data.frames: a <- data.frame(id = 1:3, v1 = c('a', NA, NA), v2 = c(NA, 'b', 'c')) b <- data.frame(id = 1:3, v1 = c(NA, 'B', 'C'), v2 = c("A", NA, NA)) > идентификатор v1 v2 ...
вопрос задан: 29 March 2012 03:30
0
ответов

Получить столбцы по строке из data.table [дубликат]

raw — это data.table, и работает следующий код:raw[,r_responseTime] #Возвращает весь столбец raw[,c_filesetSize] #То же, что и выше, возвращает столбец plot(raw[,r_responseTime]~raw[,c_filesetSize])#...
вопрос задан: 26 March 2012 11:00
0
ответов

«Прокручивать» data.table для вычисления условных средних значений

Я хочу «перебирать» строки таблицы data.table и вычислять среднее значение для каждой строки. Среднее значение следует рассчитывать на основе следующего механизма: Найдите идентификатор идентификатора в строке i (ID(i)) ...
вопрос задан: 23 March 2012 17:35
0
ответов

Агрегирование промежуточных и общих итогов с помощью data.table

У меня есть таблица data.table в R: library (data.table) set.seed (1) DT = data.table (group = sample (letter [1: 2], 100, replace = TRUE), year = sample (2010: 2012,100, replace = TRUE), v = runif (100)) Агрегирование ...
вопрос задан: 16 February 2012 20:08
0
ответов

R xts и data.table

Я могу преобразовать data.table в объект xts так же, как и с data.frame:> df = data.frame (x = c ("a", "b "," c "," d "), v = rnorm (4)) > dt = data.table (x = c ("a", "b", "c", "d"), v = rnorm (4)) ...
вопрос задан: 15 February 2012 14:30
0
ответов

Использование plyr, doMC и summarise() с очень большим набором данных?

У меня есть довольно большой набор данных (~1,4 млн строк), который я немного разбиваю и суммирую. Все это занимает некоторое время, а мое конечное приложение зависит от частого выполнения, поэтому я подумал ...
вопрос задан: 3 January 2012 12:55
0
ответов

Большое слияние / управление памятью

Я уперся в стену, пытаясь слиться файл большого размера и файл поменьше. Я прочитал много других сообщений об управлении памятью в R и не смог найти неэкстремальный (перейти на 64-битную версию, загрузить в кластер, ...
вопрос задан: 22 December 2011 09:21
0
ответов

Как выбрать строки по двум критериям в data.table в R

Допустим, у меня есть data.table, и я хочу выбрать все строки, в которых переменная x имеет значение b. Это простая библиотека (data.table) DT <- data.table (x = rep (c ("a", "b", "c"), each = 3), y = c (1,3,6), v = ...
вопрос задан: 14 December 2011 18:16
0
ответов

Я использую plyr, верно? Кажется, я использую слишком много памяти

У меня есть следующий, довольно большой набор данных:> dim (dset) [1] 422105 25> class (dset) [1] "data.frame"> Ничего не делая, Процесс R, похоже, занимает около 1 ГБ ОЗУ. Я ...
вопрос задан: 13 December 2011 14:17
0
ответов

Прокрутите столбцы в таблице data.table и преобразовать эти столбцы

У меня есть таблица data.table DT со столбцом с именем RF и многими столбцами с подчеркиванием _ в нем.Я хочу перебрать все эти столбцы с подчеркиванием и вычесть из него столбец RF. Однако я ...
вопрос задан: 4 December 2011 11:07
0
ответов

Эффективен ли мой способ дублирования строк в data.table?

У меня есть ежемесячные данные в одной data.table и годовые данные в другой data.table, и теперь я хочу сопоставить годовые данные с соответствующим наблюдением в ежемесячные данные. Мой подход заключается в следующем: ...
вопрос задан: 4 November 2011 13:28
0
ответов

Как я могу извлечь значения из data.frame на основе вектора в R?

предположим, что у меня есть числовой вектор, например: x <- c (1.0, 2.5, 3.0) и data.frame: df <- data.frame (key = c (0.5,1.0,1.5,2.0,2.5,3.0), value = c (-1.187,0.095, -0.142, -0.818, -0.734,0.511)) ключ df ...
вопрос задан: 1 November 2011 01:39
0
ответов

Разделение таблицы data.table с помощью оператора: функции, возвращающие числовые значения и / или NA fail

У меня есть таблица data.table с двумя столбцами: один столбец идентификатора и один столбец значений. Я хочу разбить таблицу по столбцу идентификатора и запустить функцию foo в столбце значения. Это прекрасно работает, пока foo делает ...
вопрос задан: 31 October 2011 23:01
0
ответов

Как можно быстро агрегировать и обобщать данные?

У меня есть набор данных, заголовки которого выглядят следующим образом: PID Time Site Rep Count Я хочу суммировать счетчик по Rep для каждой комбинации PID x Time x Site в результирующих данных. кадра, я хочу получить среднее значение Count ...
вопрос задан: 26 October 2011 14:24
0
ответов

Преобразование классов столбцов в data.table

У меня проблема с использованием data.table: Как преобразовать классы столбцов? Вот простой пример: с data.frame у меня нет проблем с его преобразованием, с data.table я просто не знаю как: df <- ...
вопрос задан: 19 October 2011 21:16
0
ответов

Почему «уникальный» выполняется быстрее в кадре данных, чем матрица в R?

Я начал верить, что кадры данных не имеют преимуществ над матрицами, за исключением удобства записи. Однако я заметил эту странность при запуске unique на матрицах и фреймах данных: кажется ...
вопрос задан: 18 October 2011 18:34
0
ответов

Извлечение уникальных строк из таблицы данных в R [дубликат]

Я переход от фреймов данных и матриц к таблицам данных, но не нашел решения для извлечения уникальных строк из таблицы данных. Полагаю, что-то мне не хватает в [, J] ...
вопрос задан: 26 September 2011 22:52
0
ответов

Правильный / самый быстрый способ изменить форму data.table

У меня есть таблица данных в R: library (data.table) набор. семена (1234) DT <- data.table (x = rep (c (1,2,3), each = 4), y = c («A», «B»), v = sample (1: 100,12)) DT xyv [1,] 1 A 12 [2,] 1 B 62 [3,] 1 A 60 [4,] ...
вопрос задан: 2 August 2011 13:52
0
ответов

Самый быстрый способ подмножества - таблица данных по сравнению с MySQL

Я пользователь R и часто обнаруживаю, что мне нужно писать функции, которые требуют подмножества больших наборов данных (десятки миллионов ряды). Когда я применяю такие функции к большому количеству наблюдений, ...
вопрос задан: 6 July 2011 01:30
0
ответов

подмножество в data.table

Я пытаюсь выделить подмножество data.table (из пакет data.table) в R (не data.frame). Я использую 4-значный год в качестве ключа. Я хотел бы выделить несколько лет. Например, я хочу ...
вопрос задан: 31 March 2011 17:12
0
ответов

data.table и символьные векторы

В моей работе Я часто называю списки переменных одним вектором символов. A <- data.table (var1 = 1:10, var2 = 11:20, var3 = 21:30) vecvar <- c ("var1", "var2", "var3") По возможности, я ...
вопрос задан: 26 March 2011 07:15