0
ответов

Учимся понимать plyr, ddply

Я пытался понять, что и как работает plyr, пробуя разные переменные и функции и наблюдая за результатами. Так что я больше ищу объяснение того, как работает plyr, чем...
вопрос задан: 6 July 2012 22:11
0
ответов

split apply recombine, plyr, data.table в R

Я выполняю классическое разделение -применение -рекомбинацию в R. Мой набор данных представляет собой группу фирм с течением времени. Я делаю регрессию для каждой фирмы и возвращаю остатки,...
вопрос задан: 1 July 2012 03:18
0
ответов

Кадр данных подмножества R зависит от значения повторяющихся переменных

Как я могу подставить следующий пример фрейма данных, чтобы вернуть только одно наблюдение для самого раннего случая [т.е. мин(год)] каждого идентификатора? id <- c("A", "A", "C", "D", "E", "F") год <- c(2000, ...
вопрос задан: 27 June 2012 13:52
0
ответов

Merge Rows within Data Frame [duplicate]

У меня есть реляционный набор данных, где я ищу диадическую информацию. У меня 4 колонки. Отправитель, Получатель, Атрибут, Край Я хочу взять повторяющийся Отправитель - Получатель подсчитывает и преобразует их ...
вопрос задан: 15 June 2012 17:35
0
ответов

Разбиение списка строк символов на разделы

Вот моя проблема. У меня есть набор данных с 200 тыс. строк. Каждая строка соответствует тесту, проведенному на предмете. Субъекты имеют неравное количество тестов. Каждое испытание датировано. Я хочу присвоить индекс ...
вопрос задан: 15 June 2012 17:31
0
ответов

Найдите и объедините повторяющиеся строки в data.frame, но игнорируйте порядок столбцов

У меня есть data.frame с 1 000 строк и 3 столбцами. Он содержит большое количество дубликатов, и я использовал plyr для объединения повторяющихся строк и добавления счетчика для каждой комбинации, как описано в этом ...
вопрос задан: 10 June 2012 19:08
0
ответов

Как установить тайм-аут, если элемент списка не работает или занимает слишком много времени?

В рамках нескольких проектов, в которых я сейчас участвую, я запускаю большие наборы данных с многочисленными комбинациями параметров с помощью ряда функций. У функций есть оболочка (поэтому я могу хлопать в ладоши) для...
вопрос задан: 8 June 2012 16:57
0
ответов

Получение предыдущих n строк во фрейме данных?

У меня есть следующий фрейм данных. значение идентификатора даты 01.01.2012 1 0,3 01.01.2012 2 0,5 01.01.2012 3 0,2 01.01.2012 4 0,8 01.01.2012 5 0,2 01.01.2012 6 0,8 01.01.2012 7 0,1 01.01.2012 8 0,4 01.01.2012 9 0,3 ...
вопрос задан: 29 May 2012 06:07
0
ответов

Отправка имени столбца в ddply из функции

Я хочу иметь возможность отправлять имя столбца в вызов, который я делаю в ddply. Пример вызова ddply :ddply (myData,. (MyGrouping ), summarise, count=sum (myColumnName ))Если я обернул ddply...
вопрос задан: 16 April 2012 18:28
0
ответов

Как преобразовать data.frame в многомерный массив в R?

Я ищу более универсальный способ перехода от data.frame к многомерному массиву. Я хотел бы иметь возможность создавать столько измерений, сколько необходимо, из такого количества переменных во фрейме данных, как...
вопрос задан: 16 April 2012 16:38
0
ответов

как присвоить уникальный идентификатор нескольким записям фрейма данных

У меня есть большой фрейм данных с тремя идентификаторами. Например: df <- data.frame(year=c(1999,1999,2000,2000,2000), country=c('K','K','M','M','S'), site=c('di','se','di','di','...
вопрос задан: 12 April 2012 06:56
0
ответов

объединить соответствующие столбцы в data.frame или data.table

У меня есть следующие data.frames: a <- data.frame(id = 1:3, v1 = c('a', NA, NA), v2 = c(NA, 'b', 'c')) b <- data.frame(id = 1:3, v1 = c(NA, 'B', 'C'), v2 = c("A", NA, NA)) > идентификатор v1 v2 ...
вопрос задан: 29 March 2012 03:30
0
ответов

Можно ли настроить пакет R plyr на параллельную работу по умолчанию?

Я делаю некоторый анализ примерно так: library(plyr) input.files <- c("file1.txt", "file2.txt", "file3.txt") input.data <- llply(input.files, load.file, .parallel=TRUE) step.one.results &...
вопрос задан: 27 March 2012 18:54
0
ответов

многоядерный с plyr, MC

Привет, я пытаюсь использовать ddply в библиотеке plyr в R с пакетом MC. Кажется, это не ускоряет вычисления. Это код, который я запускаю: require(doMC) зарегистрироватьсяDoMC(4) getDoParWorkers(...
вопрос задан: 21 March 2012 16:10
0
ответов

lm, вызванный изнутри dlply, выдает ошибку «0 (не NA) случаев» [r]

Я использую dlply() с пользовательской функцией, которая усредняет наклоны lm() подходит для данных, которые содержат некоторые значения NA, и я получаю сообщение об ошибке «Ошибка в lm.fit(x, y, offset = offset, single.ok = single.ok, ....
вопрос задан: 1 March 2012 16:34
0
ответов

Агрегирование промежуточных и общих итогов с помощью data.table

У меня есть таблица data.table в R: library (data.table) set.seed (1) DT = data.table (group = sample (letter [1: 2], 100, replace = TRUE), year = sample (2010: 2012,100, replace = TRUE), v = runif (100)) Агрегирование ...
вопрос задан: 16 February 2012 20:08
0
ответов

R colSums By Group

В следующем наборе матричных данных: 1 2 3 4 5 1950 7 20 21 15 61 1951 2 10 6 26 57 1952 12 27 43 37 34 1953 14 16 40 47 94 1954 2 17 62 113 101 1955 3 ...
вопрос задан: 31 January 2012 17:51
0
ответов

R ggplot и фасет сетка: как управлять разрывами оси x

Я пытаюсь построить график изменения временного ряда для каждого календарного года, используя ggplot, и у меня возникают проблемы с точным контролем оси x. Если я не использую scale = "free_x", я получаю x -...
вопрос задан: 21 January 2012 07:27
0
ответов

Как я могу использовать ddply с разными .variables?

Я использую ddply для суммирования некоторых data.frame по различным категориям, например: # где и группа, и размер являются факторами / категориальными split.df <- ddply (mydata,. (group, size), summarize, ...
вопрос задан: 18 January 2012 08:55
0
ответов

Использование plyr, doMC и summarise() с очень большим набором данных?

У меня есть довольно большой набор данных (~1,4 млн строк), который я немного разбиваю и суммирую. Все это занимает некоторое время, а мое конечное приложение зависит от частого выполнения, поэтому я подумал ...
вопрос задан: 3 January 2012 12:55
0
ответов

R обнуление общей суммы в начале каждого года

У меня есть фрейм данных с кучей данных о пожертвованиях. Я беру данные и размещаю их по времени от самых старых до самых последних подарков. Затем я добавляю столбец, содержащий совокупную сумму подарков за ...
вопрос задан: 16 December 2011 20:22
0
ответов

с использованием прогнозирования со списком объектов lm ()

У меня есть данные, по которым я регулярно выполняю регрессию. Каждому «фрагменту» данных соответствует разная регрессия. Например, у каждого состояния может быть своя функция, объясняющая зависимое значение. Это ...
вопрос задан: 13 December 2011 22:52
0
ответов

Я использую plyr, верно? Кажется, я использую слишком много памяти

У меня есть следующий, довольно большой набор данных:> dim (dset) [1] 422105 25> class (dset) [1] "data.frame"> Ничего не делая, Процесс R, похоже, занимает около 1 ГБ ОЗУ. Я ...
вопрос задан: 13 December 2011 14:17
0
ответов

Несколько графиков плотности для разных групп (на основе уровня фактора) с использованием plyr

Я пытаюсь вывести график нескольких плотностей из функции, разделив фрейм данных на части, чтобы разделить плотность для каждого уровня фактора для соответствующей yvar . set.seed (1234) Aa = c (...
вопрос задан: 13 November 2011 21:17
0
ответов

Вставить столбцы из двух фреймов данных

Иногда мне хочется склеивать столбцы из разных фреймов данных (таблиц, матриц и т. Д.). Например, у меня есть таблица средств и таблица разработчиков stan. Мне нужны два ...
вопрос задан: 3 November 2011 01:21
0
ответов

приведение множественного вывода в новый фрейм данных с помощью ddply

У меня есть эта функция:> λ.est <- function (x) {mle.optim <- mle2 (paretoNLL , start = list (λ = -0.7), data = list (x = x), trace = TRUE) return (summary (mle.optim) @coef [1,1: 4]) ...
вопрос задан: 28 October 2011 14:29
0
ответов

Как можно быстро агрегировать и обобщать данные?

У меня есть набор данных, заголовки которого выглядят следующим образом: PID Time Site Rep Count Я хочу суммировать счетчик по Rep для каждой комбинации PID x Time x Site в результирующих данных. кадра, я хочу получить среднее значение Count ...
вопрос задан: 26 October 2011 14:24
0
ответов

Как использовать ddply для добавления столбца во фрейм данных?

У меня есть фрейм данных, который выглядит следующим образом: дата сайта var dil 1 A 7,4 2 2 A 6,5 2 1 A 7,3 3 2 A 7,3 3 1 B 7.1 1 2 B 7.7 2 1 ...
вопрос задан: 27 September 2011 17:25
0
ответов

ddply с функцией lm ()

Привет, ребята, как я могу использовать функцию ddply для линейной модели: x1 <- c (1:10, 1:10) {{1 }} x2 <- c (1: 5, 1: 5, 1: 5, 1: 5) x3 <- c (rep (1,5), rep (2,5), rep (1 , 5), rep (2,5)) set.seed (123) y <- rnorm (20, 10, 3) ...
вопрос задан: 23 September 2011 08:50
0
ответов

Проблема, загрузка пакета PLYR

Я использую R 2.13.1 и безуспешно пытался загрузить пакет «Plyr 1.6» в R , Я вручную установил его в каталог "~ / r / library". Мой код: .libpaths ("~ ~ r / r / library") Библиотека (plyr) I ...
вопрос задан: 1 September 2011 21:14