В data.frame (или data.table) я хотел бы «заполнить вперед» NA ближайшим предыдущим значением, отличным от NA. Вот простой пример использования векторов (вместо data.frame):> y <- c (...
Для каждой строки моих данных я хотел бы вычислить сумму самого последнего значения для каждой группы: ',' a '), значение = c (10, 5, 20, 15, 15, 10), ...
Я сохранил имена data.table в виде вектора: библиотека (data.table) set.seed (42) DT < - data.table (x = runif (100), y = runif (100)) names1 < - names (DT) Насколько я могу судить, это просто ...
Чтобы избавиться от столбца с именем "foo" в data.frame, я могу сделать следующее: df <- df[-grep('foo', colnames(df))] Однако, когда df преобразуется в объект data.table, нет возможности просто удалить столбец. ...
При тестировании моего кода я обнаружил следующее: Если я назначу data.table DT1 на DT и изменю DT впоследствии DT1 изменяется вместе с ним. Итак, DT и DT1 кажутся внутренне связанными. Это предназначено ...
С помощью R я пытаюсь обрезать значения NA из начала и конца фрейма данных, содержащего несколько временных рядов. Я достиг своей цели, используя цикл for и пакет zoo, но, как и ожидалось, это...
У меня есть база данных среднего размера с большим количеством объединений и таблиц поиска. Я больше знаком с R, чем с SQL, и использую MySQL. Мой вопрос: В какой момент целесообразно прекратить увеличение...
Недавно я столкнулся с пакетом data.table.
Я до сих пор не уверен, как выполнять матричные операции по строкам.
Он изначально предназначался для обработки таких операций?
Например, что такое data.table...
Набор данных ниже имеет характеристики моего большого набора данных. Я управляю этим в data.table, некоторые столбцы загружаются как chr, несмотря на то, что они являются числами, и я хочу преобразовать их в числа и эти ...
Как я могу выполнять аналитические функции, такие как функции Oracle ROW _NUMBER (), RANK ()или DENSE _RANK ()(, см.http://www.orafaq.com/node/55)на кадре данных R? Пакет CRAN "plyr" очень близок, но...
В файлах справки для dcast.data.table есть примечание о том, что реализована новая функция: «dcast.data.table позволяет столбцу value.var иметь тип списка». ..
У меня есть data.table: library (data.table) mydt < - data.table (index = 1:10) Я получаю это, когда я пробую это в глобальной среде, но не когда я нахожусь в отладчике или когда я использую это в ...
Что мне действительно нравится в data.table, так это идиома: = для изменения таблицы по ссылке без необходимости в дорогостоящих копиях. Насколько я понимаю, это один из аспектов, который делает data.table ...
Недавно я обнаружил пакет data.table и теперь задавался вопросом, следует ли мне заменить часть моего plyr-кода. Подводя итог, мне очень нравится plyr, и я в основном добился всего, чего хотел. ...
Я пытаюсь понять немного больше о том, как работают скользящие соединения, и у меня есть некоторая путаница, я надеялся, что кто-нибудь может прояснить это для меня. Возьмем конкретный пример :dt1 < -data....
data.table - это круто, потому что я могу объединять и даже объединять группы! библиотека (data.table) set.seed (42) метрики < - data.frame (ID = c (rep (1, 10), rep (2,5), rep (3,5)), ...
У меня есть следующий пример: irisDT <- as.data.table(iris) mod <- function(dat) { dat[, index:=(1: nrow(dat))] setkey(dat, index) dat <- dat[2:10] dat[, index:=NULL] invisible()
...
Например (хотя не уверен, что это наиболее репрезентативный пример): N <- 1e6
d1 <- data.frame (x = образец (N, N), y1 = rnorm (N))
d2 <- data.frame (x = sample (N, N), y2 = rnorm (N)) Это то, что у меня есть до сих пор: ...
Я имею дело с простой таблицей значений переменной даты формы
1970-01-01 В1 0,434
1970-01-01 V2 12.12
1970-01-01 V3 921.1
1970-01-02 V1 -1.10
1970 -...
Наткнулся на таблицу частот. сегодня мне пришлось расшириться до фрейма данных необработанных значений. Я смог это сделать, но мне было интересно, есть ли более быстрый способ использования пакета reshape или data.table? ...
Мы только что поговорили об этом с коллегами, и мы подумали, что стоит посмотреть, что говорят люди в стране SO. Предположим, у меня есть список из N элементов, где каждый элемент был вектором ...
Я хочу вычислить среднее значение для каждого «Дня», но для части дня (Время = 12-14). Этот код работает для меня, но я должен вводить каждый день как новую строку кода, которая будет составлять сотни строк ....
Я знаю, что здесь в SO много вопросов о способах преобразования списка data.frames в одиночный data.frame с использованием do.call или ldply, но эти вопросы касаются понимания внутренней работы ...
В файле данных есть два числовых столбца. Мне нужно вычислить среднее значение второго столбца по интервалам (например, 100) первого столбца. Я могу запрограммировать эту задачу на R, но мой код R ...
Возможно, это глупый вопрос, но я прочитал главу Кроули о кадрах данных и прошерстил Интернет, но пока не смог сделать что-нибудь работает. Вот пример набора данных, похожий на...
Каков наилучший (самый быстрый )способ реализовать функцию скользящего окна с помощью пакета data.table? Я пытаюсь вычислить скользящую медиану, но имею несколько строк на дату (из-за 2 дополнительных...
У меня есть data.table с именем enc.per.day для встреч в день. В нем 2403 строки, в которых указывается дата обслуживания и количество пациентов, посещенных в этот день. Я хотел увидеть среднее число ...
Есть ли способ использовать несколько потоков для вычислений с использованием data.table в R? Например, допустим, у меня есть следующая таблица данных :dtb < -data.table (id=rep (1 :10000, 1000 ), x=1 :1e7 )setkey (...
У меня возникли проблемы с агрегированием фрейма данных при сохранении групп в их исходном порядке (на основе первого появления в фрейме данных ). Мне удалось сделать это правильно, но я надеялся, что есть...