Я пытаюсь объединить две таблицы, в которых столбец, к которому присоединяется, имеет некоторые значения NA, так что при обнаружении NA запись дополняется NA, т. Е. Given: > x = data.table (c (1,2,3, NA, 5), ...
Для каждой строки столбца «Response» я хотел бы проверить, имеют ли 5 нижестоящих строк значения «Response» (т.е. не имеют NA), и если да, то я бы хотел вычислить среднее и стандартное отклонение ,
Почему обычный синтаксис для агрегирования столбцов в data.table dt [, sum (x), by = "y"] не работает, если мы ссылаемся на тот же столбец в j и by, то есть dt [, sum (x) , by = "x"]? библиотека (data.table) установлена ....
В следующем коде я создаю таблицу data.table и вводю некоторые данные: library (data.table) int.tables < - c ("Sheet_A", "TBL 002", "Sheet_B", "TBL 001", "Sheet_B" , "TBL 004" ...
Вдохновившись этим постом, я нашел решение добавить столбец с 1 по 2 строки до и после y == 5. Например: библиотека (data.table) DT < - fread ("grp y исключает 1 0 ..."
Недавно я наткнулся на библиотеку pandas для python, которая, согласно этому бенчмарку, выполняет очень быстрые слияния в памяти. Она даже быстрее, чем пакет data.table в R (мой любимый язык ...
Я хочу использовать data.table для хранения нескольких моделей в столбце. В настоящее время я создаю модели один за другим и хочу их хранить с помощью цикла. Поэтому мне придется инициализировать столбец ...
Трудно сформулировать мой вопрос (следовательно, трудно эффективно искать в архивах ...). Код ниже должен быть понятным. Почему во второй команде имя последнего столбца вывода не "...
Я пытаюсь создать некоторые пользовательские функции в моем пакете (mypackage), которые основаны на data.table. Мои файлы выглядят так: ОПИСАНИЕ (...) Импорт: data.table, magrittr, glue, png, jpeg R / ...
У меня есть следующие строки кода, которые пытаются перетасовать столбцы таблицы данных и переименовать их. rm (list = ls (all.names = TRUE)) Библиотека библиотеки cat ('\ 14') (data.table) (stringr) DF & lt; -matrix (...
Я попытался удалить столбцы из таблицы данных с помощью функции set, но обнаружил, что не все столбцы были удалены, но никаких предупреждений и ошибок не сообщалось. библиотека (data.table) dt & lt; - data.table (iris) ...
У меня есть большая таблица data.table с множеством пропущенных значений, разбросанных по ~ 200 000 строкам и 200 столбцам. Я хотел бы как можно эффективнее перекодировать эти значения NA на нули. два ...
У меня есть data.frame orig, который является подмножеством и назначается cpy. библиотека (data.table) orig & lt; - data.frame (id = буквы [c (2,1,2,1)], col1 = c (300,46,89,2), col2 = 1: 4, col3 = 1: 4) print (...
Редактировать 2019 :Этот вопрос был задан до изменений в data.table в ноябре 2016 года, см. принятый ответ ниже как для текущего, так и для предыдущего метода. У меня есть таблица data.table примерно с 2,5...
У меня есть следующие данные и код для округления выбранных столбцов этой таблицы данных. > структура dput (mydf) (список (vnum1 = c (0.590165705411504, -1.39939534199836, 0.720226053660755, -0.253198380120377, -0 ....
Мне нужно найти построчный минимум многих ( +60) относительно большой data.frame (~ 250 000 x 3) (или я могу эквивалентно работать с xts). set.seed (1000)
my.df <- sample (1: 5, 250000 * 3, replace = TRUE)
...
Я разрабатываю алгоритм в r (с data.tables), и мне нужно сравнить значение из одного из столбцов со значением из строки выше. Я пытался сдвинуть / привести / отставать столбец, но это не так ...
Это должно быть просто решить, но я просто застрял. У меня есть data.table, для которого мне нужно создать сложную фильтрацию, как показано на рисунке. По сути, это похоже на функцию индексации в Excel, ...
Мне нужно загрузить много rds-файлов извне, чтобы все стало намного более плавно, я склонен устанавливать DT на объектах. Возможно ли установить DT все сразу? Я пытался: lapply (ls (), setDT) lapply (список (ls ()), ...
В моих наборах данных есть столбец, в котором периоды времени (Время )представляют собой целые числа в диапазоне от a -b. Иногда могут отсутствовать периоды времени для какой-либо данной группы. Я хотел бы заполнить эти строки NA. Ниже...
Обзор Я относительно знаком с data.table, но не очень с dplyr. Я прочитал некоторые виньетки dplyr и примеры, которые всплыли на SO, и до сих пор мои выводы таковы: данные ....
Я хотел бы назначить идентификатор события потока для моего временного ряда потока и использовать замечательную агрегацию data.table по группе (идентификатор события в моем случае) для дальнейшего анализа. Прежде чем я сделал какой-либо анализ, я попробов
Скажем, у нас есть такой игрушечный пример: prueba < - data.table (aa = 1: 7, bb = c (1,2, NA, NA, 3,1,1), cc = c (1,2, NA, NA, 3,1,1), YEAR = c (1,1,1,2,2,2,2)) aa bb cc ГОД 1: 1 1 1 1 2: 2 2 2 1 3: 3 NA NA. ..
Каков наилучший способ назначить несколько столбцов с помощью data.table? Например, :f < -function (x ){c ("привет", "привет" )} x < -data.table (id = 1 :10 )Я хотел бы сделать что-то вроде этого (из...
Объекты data.table теперь имеют оператор: =. Что отличает этот оператор от всех других операторов присваивания? Кроме того, для чего он нужен, насколько он быстрее и когда его следует избегать? Объекты
Вопрос о пакете R data.table: как удалить несколько столбцов data.table в
экономичный способ? Предположим, имена столбцов, которые нужно удалить, хранятся в векторе deleteCol. В data....
Я пытаюсь написать несколько функций-оболочек, чтобы уменьшить дублирование кода с помощью data.table. Вот пример использования mtcars. Во-первых, настройте некоторые данные: библиотека (data.table)
данные (мткары)
mtcars$car <- ...
У меня небольшие проблемы с пониманием прохода -по -свойствам ссылки на data.table. Некоторые операции, кажется, «ломают» ссылку, и я хотел бы точно понять, что происходит. На...