1
ответ

data.table merge () с NA в столбце

Я пытаюсь объединить две таблицы, в которых столбец, к которому присоединяется, имеет некоторые значения NA, так что при обнаружении NA запись дополняется NA, т. Е. Given: > x = data.table (c (1,2,3, NA, 5), ...
вопрос задан: 18 January 2019 15:16
1
ответ

Как применить функцию для каждой строки столбца в таблице данных с другими строками в качестве входных данных?

Для каждой строки столбца «Response» я хотел бы проверить, имеют ли 5 ​​нижестоящих строк значения «Response» (т.е. не имеют NA), и если да, то я бы хотел вычислить среднее и стандартное отклонение ,
вопрос задан: 18 January 2019 03:10
1
ответ

Агрегирование столбца по тому же столбцу

Почему обычный синтаксис для агрегирования столбцов в data.table dt [, sum (x), by = "y"] не работает, если мы ссылаемся на тот же столбец в j и by, то есть dt [, sum (x) , by = "x"]? библиотека (data.table) установлена ​​....
вопрос задан: 16 January 2019 19:49
1
ответ

Назначить список в data.table

В следующем коде я создаю таблицу data.table и вводю некоторые данные: library (data.table) int.tables < - c ("Sheet_A", "TBL 002", "Sheet_B", "TBL 001", "Sheet_B" , "TBL 004" ...
вопрос задан: 16 January 2019 13:35
1
ответ

добавить столбец с данными в строках перед & amp; после условия

Вдохновившись этим постом, я нашел решение добавить столбец с 1 по 2 строки до и после y == 5. Например: библиотека (data.table) DT < - fread ("grp y исключает 1 0 ..."
вопрос задан: 16 January 2019 10:02
1
ответ

Назначение в data.table с использованием `: =` ведет к противоречивому поведению

Рассмотрим data.table dt: library (data.table) dt = setDT (структура (список (grp = c ("a", "a", "b", "b", "b", "c", " c "), год = c (2000, 2012, 2004, 2008, 2014, 2008, 2016), ...
вопрос задан: 15 January 2019 17:43
1
ответ

Почему слияния pandas в python были быстрее, чем слияния data.table в R в 2012 году?

Недавно я наткнулся на библиотеку pandas для python, которая, согласно этому бенчмарку, выполняет очень быстрые слияния в памяти. Она даже быстрее, чем пакет data.table в R (мой любимый язык ...
вопрос задан: 15 July 2018 07:17
1
ответ

Как инициализировать столбец data.table с пустыми списками и петлями над ним?

Я хочу использовать data.table для хранения нескольких моделей в столбце. В настоящее время я создаю модели один за другим и хочу их хранить с помощью цикла. Поэтому мне придется инициализировать столбец ...
вопрос задан: 13 July 2018 21:01
1
ответ

data.table: имя столбца не работает с j = c () и

Трудно сформулировать мой вопрос (следовательно, трудно эффективно искать в архивах ...). Код ниже должен быть понятным. Почему во второй команде имя последнего столбца вывода не "...
вопрос задан: 4 September 2017 20:16
1
ответ

R: функция data.table не работает в пакете [дубликат]

Я пытаюсь создать некоторые пользовательские функции в моем пакете (mypackage), которые основаны на data.table. Мои файлы выглядят так: ОПИСАНИЕ (...) Импорт: data.table, magrittr, glue, png, jpeg R / ...
вопрос задан: 26 April 2016 20:25
1
ответ

Переупорядочение столбцов в таблице данных, влияющих на другие переменные в R [дубликат]

У меня есть следующие строки кода, которые пытаются перетасовать столбцы таблицы данных и переименовать их. rm (list = ls (all.names = TRUE)) Библиотека библиотеки cat ('\ 14') (data.table) (stringr) DF & lt; -matrix (...
вопрос задан: 20 March 2016 22:53
1
ответ

Функция набора данных. Table not drop columns [duplicate]

Я попытался удалить столбцы из таблицы данных с помощью функции set, но обнаружил, что не все столбцы были удалены, но никаких предупреждений и ошибок не сообщалось. библиотека (data.table) dt & lt; - data.table (iris) ...
вопрос задан: 20 March 2016 22:53
1
ответ

Самый быстрый способ замены NA в большой таблице data.table

У меня есть большая таблица data.table с множеством пропущенных значений, разбросанных по ~ 200 000 строкам и 200 столбцам. Я хотел бы как можно эффективнее перекодировать эти значения NA на нули. два ...
вопрос задан: 25 March 2015 11:37
1
ответ

setkey на подмножестве неглубокой копии кадра данных разбивает начало [дубликат]

У меня есть data.frame orig, который является подмножеством и назначается cpy. библиотека (data.table) orig & lt; - data.frame (id = буквы [c (2,1,2,1)], col1 = c (300,46,89,2), col2 = 1: 4, col3 = 1: 4) print (...
вопрос задан: 24 September 2014 17:36
0
ответов

Фильтрация повторяющихся/не -уникальных строк в data.table

Редактировать 2019 :Этот вопрос был задан до изменений в data.table в ноябре 2016 года, см. принятый ответ ниже как для текущего, так и для предыдущего метода. У меня есть таблица data.table примерно с 2,5...
вопрос задан: 8 November 2019 16:36
0
ответов

Округление выбранных столбцов таблицы data.table в R

У меня есть следующие данные и код для округления выбранных столбцов этой таблицы данных. > структура dput (mydf) (список (vnum1 = c (0.590165705411504, -1.39939534199836, 0.720226053660755, -0.253198380120377, -0 ....
вопрос задан: 29 June 2019 17:04
0
ответов

Эффективные построчные операции над таблицей data.table

Мне нужно найти построчный минимум многих ( +60) относительно большой data.frame (~ 250 000 x 3) (или я могу эквивалентно работать с xts). set.seed (1000) my.df <- sample (1: 5, 250000 * 3, replace = TRUE) ...
вопрос задан: 26 June 2019 10:39
0
ответов

как ссылаться на значение сверху строки?

Я разрабатываю алгоритм в r (с data.tables), и мне нужно сравнить значение из одного из столбцов со значением из строки выше. Я пытался сдвинуть / привести / отставать столбец, но это не так ...
вопрос задан: 27 March 2019 14:44
0
ответов

R data.table - сложный фильтр с неравенствами

Это должно быть просто решить, но я просто застрял. У меня есть data.table, для которого мне нужно создать сложную фильтрацию, как показано на рисунке. По сути, это похоже на функцию индексации в Excel, ...
вопрос задан: 26 March 2019 16:53
0
ответов

Можем ли мы установить DT для нескольких объектов одновременно?

Мне нужно загрузить много rds-файлов извне, чтобы все стало намного более плавно, я склонен устанавливать DT на объектах. Возможно ли установить DT все сразу? Я пытался: lapply (ls (), setDT) lapply (список (ls ()), ...
вопрос задан: 10 March 2019 08:06
0
ответов

Самый быстрый способ добавить строки для отсутствующих временных шагов?

В моих наборах данных есть столбец, в котором периоды времени (Время )представляют собой целые числа в диапазоне от a -b. Иногда могут отсутствовать периоды времени для какой-либо данной группы. Я хотел бы заполнить эти строки NA. Ниже...
вопрос задан: 21 February 2019 12:24
0
ответов

data.table vs dplyr: один может делать что-то хорошо, другой - плохо или плохо?

Обзор Я относительно знаком с data.table, но не очень с dplyr. Я прочитал некоторые виньетки dplyr и примеры, которые всплыли на SO, и до сих пор мои выводы таковы: данные ....
вопрос задан: 23 January 2019 18:57
0
ответов

Соединение / вырезание перекрытия с помощью функции data.table :: foverlaps при назначении идентификатора события потока для временного ряда потока (включая пример данных)

Я хотел бы назначить идентификатор события потока для моего временного ряда потока и использовать замечательную агрегацию data.table по группе (идентификатор события в моем случае) для дальнейшего анализа. Прежде чем я сделал какой-либо анализ, я попробов
вопрос задан: 18 January 2019 04:11
0
ответов

Как кросс-таблицы пропусков с data.table

Скажем, у нас есть такой игрушечный пример: prueba < - data.table (aa = 1: 7, bb = c (1,2, NA, NA, 3,1,1), cc = c (1,2, NA, NA, 3,1,1), YEAR = c (1,1,1,2,2,2,2)) aa bb cc ГОД 1: 1 1 1 1 2: 2 2 2 1 3: 3 NA NA. ..
вопрос задан: 17 January 2019 00:02
0
ответов

Назначьте несколько столбцов, используя := в data.table, по группам

Каков наилучший способ назначить несколько столбцов с помощью data.table? Например, :f < -function (x ){c ("привет", "привет" )} x < -data.table (id = 1 :10 )Я хотел бы сделать что-то вроде этого (из...
вопрос задан: 13 November 2018 13:19
0
ответов

Когда следует использовать оператор: = в data.table?

Объекты data.table теперь имеют оператор: =. Что отличает этот оператор от всех других операторов присваивания? Кроме того, для чего он нужен, насколько он быстрее и когда его следует избегать? Объекты
вопрос задан: 13 November 2018 12:57
0
ответов

Почему в data.table определено: =, а не в перегрузке <-?

data.table ввел оператор: =. Почему бы не перегрузить <-?
вопрос задан: 13 November 2018 12:53
0
ответов

R: как удалить столбцы в data.table?

Вопрос о пакете R data.table: как удалить несколько столбцов data.table в экономичный способ? Предположим, имена столбцов, которые нужно удалить, хранятся в векторе deleteCol. В data....
вопрос задан: 13 November 2018 05:49
0
ответов

Использование аргументов data.table i и j в функциях

Я пытаюсь написать несколько функций-оболочек, чтобы уменьшить дублирование кода с помощью data.table. Вот пример использования mtcars. Во-первых, настройте некоторые данные: библиотека (data.table) данные (мткары) mtcars$car <- ...
вопрос задан: 31 July 2018 18:03
0
ответов

Точное понимание того, когда data.table является ссылкой на (по сравнению с копией )другой data.table

У меня небольшие проблемы с пониманием прохода -по -свойствам ссылки на data.table. Некоторые операции, кажется, «ломают» ссылку, и я хотел бы точно понять, что происходит. На...
вопрос задан: 28 May 2018 23:43