Я думаю, что неправильно использую plyr. Может ли кто-нибудь сказать мне, является ли это «эффективным» кодом plyr? требуется (плир )plyr < -функция (dd )ddply (dd,. (цена ), итог, сс=сумма (объем ))Немного...
Учитывая data.table dat :dat < -data.table (x _one=1 :10, x _two=1 :10, y _one= 1 :10, y _two=1 :10 )Мне нужна функция, которая создает выражение между двумя одинаковыми строками с учетом их «корневого» имени, например....
Привет, я хочу выбрать группу значений, зависящих от значения в таблице данных. В частности, я хотел бы выбрать все столбцы, сгруппированные по дате и идентификатору, для всех положительных значений, где e == 1 id date...
У меня есть две таблицы данных :DT и мета. Когда я объединяю их с помощью DT[meta], использование памяти увеличивается более чем на 10 ГБ (и слияние происходит очень медленно ). Что происходит не так? Похоже, слияние прошло успешно,...
У меня есть очень большой фрейм данных в R, и я хотел бы суммировать два столбца для каждого отдельного значения в других столбцах, например, скажем, у нас были данные фрейма данных транзакций в различных магазинах в течение дня...
При использовании пакета data.table я немного не уверен, когда мне нужно установить ключ (). Например, при использовании оператора := с параметром by кажется, что все по-прежнему работает очень быстро, хотя я не...
Этот вопрос касается общего механизма для преобразования любого набора не-циклических однородных или разнородных структур данных в кадр данных. Это может быть особенно полезно при работе с...
Можно ли сделать эквивалент слияния (..., all = TRUE )с синтаксисом data.table (, например X[Y] )? В частности, мне нужен очень быстрый способ получить результат :item _length = data....
Из-за нехватки времени я решил использовать в своем коде таблицы данных вместо фреймов данных, так как они намного быстрее. Тем не менее, я все еще хочу функциональность фреймов данных. Мне нужно объединить два данных...
Данные, которые выглядят как :библиотека (data.table )DT < -data.table (x=rep (1 :5, 2 ))Я хотел бы разбить эти данные на 5 логических столбцов, которые указывают на наличие каждого числа. Я могу это сделать...
У меня есть функция, которая возвращает два значения в списке. Оба значения необходимо добавить в таблицу данных в два новых столбца. Вычисление функции требует больших затрат, поэтому я хотел бы избежать вычислений...
Я выполняю классическое разделение -применение -рекомбинацию в R. Мой набор данных представляет собой группу фирм с течением времени. Я делаю регрессию для каждой фирмы и возвращаю остатки,...
Пакет data.table очень полезен с точки зрения скорости. Но у меня возникли проблемы с использованием результатов линейной регрессии. Есть ли простой способ получить вывод data.table как...
У меня есть объект data.table, подобный этой библиотеке (data.table )a < -структура (list (PERMNO = c (10006L, 10006L, 10015L, 10015L, 20000L, 20000L ), SHROUT = c (1427L, 1427L, 1000L,...
В моей платформе . Rprofile У меня есть следующие две строки, определенные в моем . Сначала makeActiveBinding(".refresh", function() { system("R"); q("no") }, . ГлобалЭнв)
makeActiveBinding('.rm', function() {rm(list=ls(...
Как я могу подставить следующий пример фрейма данных, чтобы вернуть только одно наблюдение для самого раннего случая [т.е. мин(год)] каждого идентификатора? id <- c("A", "A", "C", "D", "E", "F")
год <- c(2000, ...
Я заметил некоторое непоследовательное (несовместимое для меня) поведение в data.table при использовании разных операторов присваивания. Должен признаться, я так и не понял разницы между "=" и copy(), так что, может быть...
У меня есть фрейм данных, как показано ниже (20 000 строк по 49 столбцов). Каждая строка имеет уникальное имя (ID), каждый ID имеет 3 повторения чтения в 3 столбцах (например, D15C D15C.1 D15C.2). Первые 4 буквы названий столбцов ("D15C")...
У меня есть фрейм данных, содержащий около 35 000 строк по 7 столбцов. это выглядит так: head(nuc) chr feature start end gene_id pctAT pctGC length
1 1 CDS 67000042 67000051 ...
У меня есть два фрейма данных; один из них имеет длину 48 рядов и выглядит так: name = Z31 Est.Date Site Cultivar Planting
1 24.07.2011 Березовый топор 1
2 08.08.2011 Берчип Болак 1
...
У меня есть реляционный набор данных, где я ищу диадическую информацию. У меня 4 колонки. Отправитель, Получатель, Атрибут, Край Я хочу взять повторяющийся Отправитель - Получатель подсчитывает и преобразует их ...
Вот моя проблема. У меня есть набор данных с 200 тыс. строк. Каждая строка соответствует тесту, проведенному на предмете. Субъекты имеют неравное количество тестов.
Каждое испытание датировано. Я хочу присвоить индекс ...
У меня есть data.frame в R с 19 миллионами строк и 90 столбцами. У меня много запасных циклов оперативной памяти и процессора. Кажется, что изменение имени одного столбца в этом фрейме данных — очень трудоемкая операция для...
Мои данные У меня есть data.table DT с текущим (F0YR) и следующим (F1YR) концом финансового года (FYE), закодированными как целые числа. Поскольку каждый следующий FYE в конечном итоге станет
текущий FYE, целое число будет ...
Для data.table (или data.frame) в R я хочу найти все строки, которые содержат значение в столбце «значение», которое представляет собой заданное расстояние «расстояние» от другого значения в строке с тем же ключом. Итак, учитывая ...
Ищу лучшую альтернативу еще не реализованному (насколько мне известно) присвоению по ссылке в data.table по группам. Используя пример data.table, DT = data.table(x=rep(c("a","b","c")...
Я пытаюсь изучить пакет data.table в R. У меня есть таблица данных с именем DT1 и кадр данных DF1, и я хочу разделить некоторые экземпляры на подмножества в соответствии с логическим условием (дизъюнкцией). Это мой код...
Я хотел бы понять логику, которую использует R при передаче аргументов функциям, создании копий переменных и т. д. в отношении использования памяти. Когда он на самом деле создает копию ...
Я столкнулся с небольшой проблемой R с data.table. Ваша помощь очень ценится. Как это сделать: getResult <- function(dt, expr, gby) { e <- replace(expr) b <- replace(gby) ...