Я хочу определить классы столбцов большой data.table. colClasses <- sapply(DT, FUN=function(x)class(x)[1]) работает, но видимо локальные копии хранятся в памяти: > memory.size()
[...
Я пытаюсь использовать пакет data.table внутри своего собственного пакета . MWE заключается в следующем: я создаю функцию test.fun, которая просто создает небольшой объект data.table, а затем суммирует столбец "Val"...
Предположим, у меня есть длинный вектор vec (, начинающийся с 1E8 элементов ), и я хочу ограничить его диапазоном [а, б]. Я, конечно, могу закодировать vec[vec < a] = a и vec[vec > b] = b, но это...
Учитывая ключ сортировки, есть ли ярлык в data.table для дублирования первой и последние функции, обнаруженные в SAS и SPSS? Пешеходный подход ниже отмечает первую запись группы. Учитывая...
Надеюсь, что здесь есть простой ответ, но я нигде не могу его найти. У меня есть числовая матрица с помеченными строками и столбцами: 1 2 3 4
а 6 7 8 9
б 8 7 5 7
c 8 ...
Я ищу общее решение для обновления одного большого фрейма данных содержимым второго аналогичного фрейма данных. У меня есть десятки наборов данных, каждый с тысячами строк и более 10 000...
Пакет R data.table предлагает быстрое подмножество значений на основе ключей. Так, например, :set.seed(1342)df1 <-data.table(group = gl(10, 10, labels = letter[1:10]), value =...
Пакет data.table предоставляет многие из тех же методов обработки таблиц, что и SQL. ключ, этот ключ состоит из одного или нескольких столбцов. Но таблица не может иметь более одного ключа, потому что она может "...
raw — это data.table, и работает следующий код:raw[,r_responseTime] #Возвращает весь столбец raw[,c_filesetSize] #То же, что и выше, возвращает столбец plot(raw[,r_responseTime]~raw[,c_filesetSize])#...
Я хочу «перебирать» строки таблицы data.table и вычислять среднее значение для каждой строки. Среднее значение следует рассчитывать на основе следующего механизма: Найдите идентификатор идентификатора в строке i (ID(i))
...
Я могу преобразовать data.table в объект xts так же, как и с data.frame:> df = data.frame (x = c ("a", "b "," c "," d "), v = rnorm (4))
> dt = data.table (x = c ("a", "b", "c", "d"), v = rnorm (4))
...
У меня есть довольно большой набор данных (~1,4 млн строк), который я немного разбиваю и суммирую. Все это занимает некоторое время, а мое конечное приложение зависит от частого выполнения, поэтому я подумал ...
Я уперся в стену, пытаясь слиться файл большого размера и файл поменьше. Я прочитал много других сообщений об управлении памятью в R и не смог найти неэкстремальный (перейти на 64-битную версию, загрузить в кластер, ...
Допустим, у меня есть data.table, и я хочу выбрать все строки, в которых переменная x имеет значение b. Это простая библиотека (data.table)
DT <- data.table (x = rep (c ("a", "b", "c"), each = 3), y = c (1,3,6), v = ...
У меня есть следующий, довольно большой набор данных:> dim (dset) [1] 422105 25> class (dset) [1] "data.frame"> Ничего не делая, Процесс R, похоже, занимает около 1 ГБ ОЗУ. Я ...
У меня есть таблица data.table DT со столбцом с именем RF и многими столбцами с подчеркиванием _ в нем.Я хочу перебрать все эти столбцы с подчеркиванием и вычесть из него столбец RF. Однако я ...
У меня есть ежемесячные данные в одной data.table и годовые данные в другой data.table, и теперь я хочу сопоставить годовые данные с соответствующим наблюдением в ежемесячные данные. Мой подход заключается в следующем: ...
предположим, что у меня есть числовой вектор, например: x <- c (1.0, 2.5, 3.0) и data.frame: df <- data.frame (key = c (0.5,1.0,1.5,2.0,2.5,3.0), value = c (-1.187,0.095, -0.142, -0.818, -0.734,0.511)) ключ df ...
У меня есть таблица data.table с двумя столбцами: один столбец идентификатора и один столбец значений. Я хочу разбить таблицу по столбцу идентификатора и запустить функцию foo в столбце значения. Это прекрасно работает, пока foo делает ...
У меня есть набор данных, заголовки которого выглядят следующим образом: PID Time Site Rep Count Я хочу суммировать счетчик по Rep для каждой комбинации PID x Time x Site в результирующих данных. кадра, я хочу получить среднее значение Count ...
У меня проблема с использованием data.table: Как преобразовать классы столбцов? Вот простой пример: с data.frame у меня нет проблем с его преобразованием, с data.table я просто не знаю как: df <- ...
Я начал верить, что кадры данных не имеют преимуществ над матрицами, за исключением удобства записи. Однако я заметил эту странность при запуске unique на матрицах и фреймах данных: кажется ...
Я переход от фреймов данных и матриц к таблицам данных, но не нашел решения для извлечения уникальных строк из таблицы данных. Полагаю, что-то мне не хватает в [, J] ...
У меня есть таблица данных в R: library (data.table)
набор. семена (1234)
DT <- data.table (x = rep (c (1,2,3), each = 4), y = c («A», «B»), v = sample (1: 100,12))
DT xyv [1,] 1 A 12 [2,] 1 B 62 [3,] 1 A 60 [4,] ...
Я пользователь R и часто обнаруживаю, что мне нужно писать функции, которые требуют подмножества больших наборов данных (десятки миллионов ряды). Когда я применяю такие функции к большому количеству наблюдений, ...
Я пытаюсь выделить подмножество data.table (из пакет data.table) в R (не data.frame). Я использую 4-значный год в качестве ключа. Я хотел бы выделить несколько лет. Например, я хочу ...
В моей работе Я часто называю списки переменных одним вектором символов. A <- data.table (var1 = 1:10, var2 = 11:20, var3 = 21:30)
vecvar <- c ("var1", "var2", "var3") По возможности, я ...