0
ответов

Замена NA последним значением, отличным от NA

В data.frame (или data.table) я хотел бы «заполнить вперед» NA ближайшим предыдущим значением, отличным от NA. Вот простой пример использования векторов (вместо data.frame):> y <- c (...
вопрос задан: 22 June 2016 11:54
0
ответов

Сумма самых последних значений по группам

Для каждой строки моих данных я хотел бы вычислить сумму самого последнего значения для каждой группы: ',' a '), значение = c (10, 5, 20, 15, 15, 10), ...
вопрос задан: 9 June 2016 17:09
0
ответов

Почему data.table обновляет имена (DT) по ссылке, даже если я назначаю другую переменную?

Я сохранил имена data.table в виде вектора: библиотека (data.table) set.seed (42) DT < - data.table (x = runif (100), y = runif (100)) names1 < - names (DT) Насколько я могу судить, это просто ...
вопрос задан: 20 March 2016 21:53
0
ответов

Как удалить столбец по имени в data.table?

Чтобы избавиться от столбца с именем "foo" в data.frame, я могу сделать следующее: df <- df[-grep('foo', colnames(df))] Однако, когда df преобразуется в объект data.table, нет возможности просто удалить столбец. ...
вопрос задан: 26 February 2016 11:22
0
ответов

: оператор = (передать по ссылке) в пакете data.table одновременно изменяет другой объект таблицы данных

При тестировании моего кода я обнаружил следующее: Если я назначу data.table DT1 на DT и изменю DT впоследствии DT1 изменяется вместе с ним. Итак, DT и DT1 кажутся внутренне связанными. Это предназначено ...
вопрос задан: 7 December 2015 21:58
0
ответов

Эффективное удаление пропущенных значений из начала и конца нескольких временных рядов в 1 фрейме данных.

С помощью R я пытаюсь обрезать значения NA из начала и конца фрейма данных, содержащего несколько временных рядов. Я достиг своей цели, используя цикл for и пакет zoo, но, как и ожидалось, это...
вопрос задан: 4 December 2015 16:05
0
ответов

Когда использовать R, когда использовать SQL?

У меня есть база данных среднего размера с большим количеством объединений и таблиц поиска. Я больше знаком с R, чем с SQL, и использую MySQL. Мой вопрос: В какой момент целесообразно прекратить увеличение...
вопрос задан: 4 December 2015 13:37
0
ответов

Построчные матричные операции в R

Недавно я столкнулся с пакетом data.table. Я до сих пор не уверен, как выполнять матричные операции по строкам. Он изначально предназначался для обработки таких операций? Например, что такое data.table...
вопрос задан: 26 July 2015 06:18
0
ответов

Как преобразовать символ в число в data.table для определенных столбцов?

Набор данных ниже имеет характеристики моего большого набора данных. Я управляю этим в data.table, некоторые столбцы загружаются как chr, несмотря на то, что они являются числами, и я хочу преобразовать их в числа и эти ...
вопрос задан: 7 April 2015 15:26
0
ответов

Как эмулировать SQL «partition by» в R?

Как я могу выполнять аналитические функции, такие как функции Oracle ROW _NUMBER (), RANK ()или DENSE _RANK ()(, см.http://www.orafaq.com/node/55)на кадре данных R? Пакет CRAN "plyr" очень близок, но...
вопрос задан: 23 January 2015 20:34
0
ответов

может ли value.var в dcast быть списком или иметь несколько переменных-значений?

В файлах справки для dcast.data.table есть примечание о том, что реализована новая функция: «dcast.data.table позволяет столбцу value.var иметь тип списка». ..
вопрос задан: 9 August 2014 22:41
0
ответов

data.table выбрасывает & ldquo; объект не найден & rdquo; ошибка [дубликат]

У меня есть data.table: library (data.table) mydt < - data.table (index = 1:10) Я получаю это, когда я пробую это в глобальной среде, но не когда я нахожусь в отладчике или когда я использую это в ...
вопрос задан: 2 July 2014 14:35
0
ответов

Изменяет ли мутирование tbl по ссылке?

Что мне действительно нравится в data.table, так это идиома: = для изменения таблицы по ссылке без необходимости в дорогостоящих копиях. Насколько я понимаю, это один из аспектов, который делает data.table ...
вопрос задан: 11 February 2014 14:19
0
ответов

Использование дат с пакетом data.table

Недавно я обнаружил пакет data.table и теперь задавался вопросом, следует ли мне заменить часть моего plyr-кода. Подводя итог, мне очень нравится plyr, и я в основном добился всего, чего хотел. ...
вопрос задан: 23 January 2014 18:03
0
ответов

скользящие соединения data.table в R

Я пытаюсь понять немного больше о том, как работают скользящие соединения, и у меня есть некоторая путаница, я надеялся, что кто-нибудь может прояснить это для меня. Возьмем конкретный пример :dt1 < -data....
вопрос задан: 15 November 2013 22:11
0
ответов

Вращающиеся соединения: крен вперед и назад

data.table - это круто, потому что я могу объединять и даже объединять группы! библиотека (data.table) set.seed (42) метрики < - data.frame (ID = c (rep (1, 10), rep (2,5), rep (3,5)), ...
вопрос задан: 8 April 2013 22:16
0
ответов

Удаление столбцов data.table внутри функции

У меня есть следующий пример: irisDT <- as.data.table(iris) mod <- function(dat) { dat[, index:=(1: nrow(dat))] setkey(dat, index) dat <- dat[2:10] dat[, index:=NULL] invisible() ...
вопрос задан: 29 January 2013 14:16
0
ответов

Какой самый быстрый способ объединить / объединить data.frames в R?

Например (хотя не уверен, что это наиболее репрезентативный пример): N <- 1e6 d1 <- data.frame (x = образец (N, N), y1 = rnorm (N)) d2 <- data.frame (x = sample (N, N), y2 = rnorm (N)) Это то, что у меня есть до сих пор: ...
вопрос задан: 7 November 2012 10:38
0
ответов

Самый быстрый поворот в ширину в R

Я имею дело с простой таблицей значений переменной даты формы 1970-01-01 В1 0,434 1970-01-01 V2 12.12 1970-01-01 V3 921.1 1970-01-02 V1 -1.10 1970 -...
вопрос задан: 16 October 2012 23:27
0
ответов

изменение формы данных (более быстрый способ)

Наткнулся на таблицу частот. сегодня мне пришлось расшириться до фрейма данных необработанных значений. Я смог это сделать, но мне было интересно, есть ли более быстрый способ использования пакета reshape или data.table? ...
вопрос задан: 5 October 2012 09:07
0
ответов

Самый эффективный метод list to data.frame?

Мы только что поговорили об этом с коллегами, и мы подумали, что стоит посмотреть, что говорят люди в стране SO. Предположим, у меня есть список из N элементов, где каждый элемент был вектором ...
вопрос задан: 21 September 2012 13:12
0
ответов

R: Вычислить среднее для подмножества группы

Я хочу вычислить среднее значение для каждого «Дня», но для части дня (Время = 12-14). Этот код работает для меня, но я должен вводить каждый день как новую строку кода, которая будет составлять сотни строк ....
вопрос задан: 11 September 2012 02:08
0
ответов

Проблемы с преобразованием длинного списка data.frames (~1 миллион) в один data.frame с использованием do.call и ldply

Я знаю, что здесь в SO много вопросов о способах преобразования списка data.frames в одиночный data.frame с использованием do.call или ldply, но эти вопросы касаются понимания внутренней работы ...
вопрос задан: 6 September 2012 12:40
0
ответов

Эффективное усреднение второго столбца по интервалам, определенным первым столбцом.

В файле данных есть два числовых столбца. Мне нужно вычислить среднее значение второго столбца по интервалам (например, 100) первого столбца. Я могу запрограммировать эту задачу на R, но мой код R ...
вопрос задан: 5 September 2012 15:48
0
ответов

Суммирование строк на основе определенных комбинаций факторов

Возможно, это глупый вопрос, но я прочитал главу Кроули о кадрах данных и прошерстил Интернет, но пока не смог сделать что-нибудь работает. Вот пример набора данных, похожий на...
вопрос задан: 2 September 2012 23:54
0
ответов

Скользящее окно R data.table

Каков наилучший (самый быстрый )способ реализовать функцию скользящего окна с помощью пакета data.table? Я пытаюсь вычислить скользящую медиану, но имею несколько строк на дату (из-за 2 дополнительных...
вопрос задан: 31 August 2012 04:16
0
ответов

Почему медиана отключает data.table (целое число против двойного)?

У меня есть data.table с именем enc.per.day для встреч в день. В нем 2403 строки, в которых указывается дата обслуживания и количество пациентов, посещенных в этот день. Я хотел увидеть среднее число ...
вопрос задан: 25 August 2012 20:23
0
ответов

использование data.table с несколькими потоками в R

Есть ли способ использовать несколько потоков для вычислений с использованием data.table в R? Например, допустим, у меня есть следующая таблица данных :dtb < -data.table (id=rep (1 :10000, 1000 ), x=1 :1e7 )setkey (...
вопрос задан: 17 August 2012 20:51
0
ответов

Совокупный кадр данных с сохранением исходного порядка простым способом

У меня возникли проблемы с агрегированием фрейма данных при сохранении групп в их исходном порядке (на основе первого появления в фрейме данных ). Мне удалось сделать это правильно, но я надеялся, что есть...
вопрос задан: 16 August 2012 10:27
0
ответов

Как заполнить NA медианой?

Пример данных :начальное значение (1 )df < -data.frame (years=sort (rep (2005 :2010, 12 )), month=1 :12, value=c (rnorm (60 ),NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,NA ))головка (df )...
вопрос задан: 16 August 2012 08:33