0
ответов

Почему plyr такой медленный?

Я думаю, что неправильно использую plyr. Может ли кто-нибудь сказать мне, является ли это «эффективным» кодом plyr? требуется (плир )plyr < -функция (dd )ddply (dd,. (цена ), итог, сс=сумма (объем ))Немного...
вопрос задан: 8 August 2012 22:44
0
ответов

создать выражение из функции для data.table для eval

Учитывая data.table dat :dat < -data.table (x _one=1 :10, x _two=1 :10, y _one= 1 :10, y _two=1 :10 )Мне нужна функция, которая создает выражение между двумя одинаковыми строками с учетом их «корневого» имени, например....
вопрос задан: 8 August 2012 20:40
0
ответов

Выбор группы R зависит от значения в data.table

Привет, я хочу выбрать группу значений, зависящих от значения в таблице данных. В частности, я хотел бы выбрать все столбцы, сгруппированные по дате и идентификатору, для всех положительных значений, где e == 1 id date...
вопрос задан: 8 August 2012 14:04
0
ответов

Объединение data.tables использует более 10 ГБ ОЗУ

У меня есть две таблицы данных :DT и мета. Когда я объединяю их с помощью DT[meta], использование памяти увеличивается более чем на 10 ГБ (и слияние происходит очень медленно ). Что происходит не так? Похоже, слияние прошло успешно,...
вопрос задан: 8 August 2012 13:21
0
ответов

Сумма по отдельному значению столбца в R

У меня есть очень большой фрейм данных в R, и я хотел бы суммировать два столбца для каждого отдельного значения в других столбцах, например, скажем, у нас были данные фрейма данных транзакций в различных магазинах в течение дня...
вопрос задан: 2 August 2012 21:34
0
ответов

setkey и := оператор, data.table, R

При использовании пакета data.table я немного не уверен, когда мне нужно установить ключ (). Например, при использовании оператора := с параметром by кажется, что все по-прежнему работает очень быстро, хотя я не...
вопрос задан: 20 July 2012 18:03
0
ответов

R :Общее сведение JSON к data.frame

Этот вопрос касается общего механизма для преобразования любого набора не-циклических однородных или разнородных структур данных в кадр данных. Это может быть особенно полезно при работе с...
вопрос задан: 19 July 2012 03:39
0
ответов

конфликты имен функций

Какие есть хорошие шаблоны для разработки пакетов, определяющих одну и ту же функцию? В моем случае lubridate и data.table определяют wday.
вопрос задан: 15 July 2012 08:13
0
ответов

быстрое слияние (…, все = ИСТИНА )с data.table в R

Можно ли сделать эквивалент слияния (..., all = TRUE )с синтаксисом data.table (, например X[Y] )? В частности, мне нужен очень быстрый способ получить результат :item _length = data....
вопрос задан: 11 July 2012 16:43
0
ответов

Объединение таблиц данных, таких как фреймы данных в R

Из-за нехватки времени я решил использовать в своем коде таблицы данных вместо фреймов данных, так как они намного быстрее. Тем не менее, я все еще хочу функциональность фреймов данных. Мне нужно объединить два данных...
вопрос задан: 11 July 2012 15:40
0
ответов

Преобразование столбца факторов в несколько столбцов логических значений

Данные, которые выглядят как :библиотека (data.table )DT < -data.table (x=rep (1 :5, 2 ))Я хотел бы разбить эти данные на 5 логических столбцов, которые указывают на наличие каждого числа. Я могу это сделать...
вопрос задан: 5 July 2012 18:41
0
ответов

Добавить несколько столбцов в R data.table одним вызовом функции?

У меня есть функция, которая возвращает два значения в списке. Оба значения необходимо добавить в таблицу данных в два новых столбца. Вычисление функции требует больших затрат, поэтому я хотел бы избежать вычислений...
вопрос задан: 3 July 2012 10:13
0
ответов

split apply recombine, plyr, data.table в R

Я выполняю классическое разделение -применение -рекомбинацию в R. Мой набор данных представляет собой группу фирм с течением времени. Я делаю регрессию для каждой фирмы и возвращаю остатки,...
вопрос задан: 1 July 2012 03:18
0
ответов

data.table и результат регрессии plyr

Пакет data.table очень полезен с точки зрения скорости. Но у меня возникли проблемы с использованием результатов линейной регрессии. Есть ли простой способ получить вывод data.table как...
вопрос задан: 29 June 2012 18:27
0
ответов

Группировка в data.table :как получить более 1 столбца результатов?

У меня есть объект data.table, подобный этой библиотеке (data.table )a < -структура (list (PERMNO = c (10006L, 10006L, 10015L, 10015L, 20000L, 20000L ), SHROUT = c (1427L, 1427L, 1000L,...
вопрос задан: 27 June 2012 18:57
0
ответов

Функция data.table tables() запускает некоторые из моих . Функции Rprofile

В моей платформе . Rprofile У меня есть следующие две строки, определенные в моем . Сначала makeActiveBinding(".refresh", function() { system("R"); q("no") }, . ГлобалЭнв) makeActiveBinding('.rm', function() {rm(list=ls(...
вопрос задан: 27 June 2012 16:38
0
ответов

Кадр данных подмножества R зависит от значения повторяющихся переменных

Как я могу подставить следующий пример фрейма данных, чтобы вернуть только одно наблюдение для самого раннего случая [т.е. мин(год)] каждого идентификатора? id <- c("A", "A", "C", "D", "E", "F") год <- c(2000, ...
вопрос задан: 27 June 2012 13:52
0
ответов

data.table 1.8.1.: «DT1 = DT2» — это не то же самое, что DT1 = копировать (DT2)?

Я заметил некоторое непоследовательное (несовместимое для меня) поведение в data.table при использовании разных операторов присваивания. Должен признаться, я так и не понял разницы между "=" и copy(), так что, может быть...
вопрос задан: 25 June 2012 15:34
0
ответов

Строка R означает несколько столбцов по группам (или уникальным идентификаторам).

У меня есть фрейм данных, как показано ниже (20 000 строк по 49 столбцов). Каждая строка имеет уникальное имя (ID), каждый ID имеет 3 повторения чтения в 3 столбцах (например, D15C D15C.1 D15C.2). Первые 4 буквы названий столбцов ("D15C")...
вопрос задан: 25 June 2012 14:30
0
ответов

lapply и do.call работают очень медленно?

У меня есть фрейм данных, содержащий около 35 000 строк по 7 столбцов. это выглядит так: head(nuc) chr feature start end gene_id pctAT pctGC length 1 1 CDS 67000042 67000051 ...
вопрос задан: 18 June 2012 23:53
0
ответов

R – Нужна помощь в ускорении цикла for

У меня есть два фрейма данных; один из них имеет длину 48 рядов и выглядит так: name = Z31 Est.Date Site Cultivar Planting 1 24.07.2011 Березовый топор 1 2 08.08.2011 Берчип Болак 1 ...
вопрос задан: 15 June 2012 18:00
0
ответов

Merge Rows within Data Frame [duplicate]

У меня есть реляционный набор данных, где я ищу диадическую информацию. У меня 4 колонки. Отправитель, Получатель, Атрибут, Край Я хочу взять повторяющийся Отправитель - Получатель подсчитывает и преобразует их ...
вопрос задан: 15 June 2012 17:35
0
ответов

Разбиение списка строк символов на разделы

Вот моя проблема. У меня есть набор данных с 200 тыс. строк. Каждая строка соответствует тесту, проведенному на предмете. Субъекты имеют неравное количество тестов. Каждое испытание датировано. Я хочу присвоить индекс ...
вопрос задан: 15 June 2012 17:31
0
ответов

Почему изменение имени столбца занимает очень много времени при большом data.frame?

У меня есть data.frame в R с 19 миллионами строк и 90 столбцами. У меня много запасных циклов оперативной памяти и процессора. Кажется, что изменение имени одного столбца в этом фрейме данных — очень трудоемкая операция для...
вопрос задан: 15 June 2012 10:27
0
ответов

Как лучше всего соединить один столбец таблицы данных с другим столбцом той же таблицы данных?

Мои данные У меня есть data.table DT с текущим (F0YR) и следующим (F1YR) концом финансового года (FYE), закодированными как целые числа. Поскольку каждый следующий FYE в конечном итоге станет текущий FYE, целое число будет ...
вопрос задан: 14 June 2012 09:51
0
ответов

Найти строки с заданной разницей между значениями в столбце

Для data.table (или data.frame) в R я хочу найти все строки, которые содержат значение в столбце «значение», которое представляет собой заданное расстояние «расстояние» от другого значения в строке с тем же ключом. Итак, учитывая ...
вопрос задан: 24 May 2012 13:55
0
ответов

data.table эффективная альтернатива групповому присвоению как DT[ ,x:=f(y),by=z]?

Ищу лучшую альтернативу еще не реализованному (насколько мне известно) присвоению по ссылке в data.table по группам. Используя пример data.table, DT = data.table(x=rep(c("a","b","c")...
вопрос задан: 24 May 2012 01:00
0
ответов

Как бы вы перевели это на язык пакета data.table в R?

Я пытаюсь изучить пакет data.table в R. У меня есть таблица данных с именем DT1 и кадр данных DF1, и я хочу разделить некоторые экземпляры на подмножества в соответствии с логическим условием (дизъюнкцией). Это мой код...
вопрос задан: 21 May 2012 18:37
0
ответов

R, глубокие и поверхностные копии, передача по ссылке

Я хотел бы понять логику, которую использует R при передаче аргументов функциям, создании копий переменных и т. д. в отношении использования памяти. Когда он на самом деле создает копию ...
вопрос задан: 21 May 2012 15:35
0
ответов

Как в R data.table передать переменные параметры выражению?

Я столкнулся с небольшой проблемой R с data.table. Ваша помощь очень ценится. Как это сделать: getResult <- function(dt, expr, gby) { e <- replace(expr) b <- replace(gby) ...
вопрос задан: 20 May 2012 18:27