Переработка текущего процесса с двумя кадрами данных. DF1 - строки из 65kish, 15 столбцов DF2 - 300kish строк, 270 столбцов. Мы объединяем zip как таковой: newdf & lt;-merge (df1, df2, by.x = "ZipA", by.y = ...
У меня есть таблица с переменной группировки и переменной времени. Я хочу рассчитать для каждого наблюдения, сколько времени это происходит до следующего наблюдения (внутри групп). Моя идея состояла в том, чтобы присоединиться к столу с ...
У меня есть файл данных с числовыми значениями в трех столбцах и двух переменных группировки (ID и Группа), из которых мне нужно вычислить одно максимальное значение по ID и Group: structure (list (ID = structure (c (1L, ...
У меня есть datatable, который имеет столбец, который имеет целую цепочку целых чисел, разделенную запятой, разной длины. Я хочу, чтобы каждый элемент находился в отдельном столбце. Я попробовал stringr :: str_extract и базу ...
Скажем, у меня есть таблица данных. Prueba - таблица данных (aa = 1: 7, bb = c (1,2, NA, NA, 3,1,1), cc = c (1,2, NA, NA, 3,1,1), YEAR = c (1,1,1,2,2,2,2)) и я хочу ...
Повторяющаяся аналитическая парадигма, с которой я встречаюсь в своем исследовании, является потребностью к подмножеству на основе всех значений идентификаторов другой группы, выполняя статистический анализ каждой группы в свою очередь, и вставляя результ
Я узнал, что по моим исходным данным у меня есть поля, которые постоянно следуют за потреблением гранул. Однако, когда число заканчивалось на 0, нуль был опущен, и поэтому я хотел бы ...
Поскольку мой CSV-файл поврежден, я считываю его в R, используя: dataDT < - data.table :: fread ("... / test.csv", sep = NULL). И это дает набор данных примерно так: dataDT < - data.table ("ColA, ColB, ColC, ...
У меня есть два набора данных, которые я хочу объединить. Один из столбцов, который я хочу использовать в качестве ключа для слияния, имеет значения в списке. Если какое-либо из этих значений появится в столбце второго набора данных, я хочу ...
Я пытаюсь создать последовательность лет для нескольких идентификаторов в R. Моя входная таблица содержит по одной строке для каждого идентификатора и дает Start_year. Это выглядит так: ID Start_year 01 1999 02 ...
Я столкнулся с проблемой слияния, и, похоже, проблема связана с некоторыми внутренними механизмами, которые я не могу понять. У меня есть два data.table со столбцом, общим для слияния, в dt1 столбец был ...
примечание: этот вопрос и следующие ответы относятся к data.table версиям <1.5.3; v. 1.5.3 был выпущен в феврале 2011 для решения этого вопроса. посмотрите более свежую обработку (03-2012): Перевод SQL...
Я работаю над структурой таблиц данных, и я хочу создать новый столбец на основе вызова функции, использующей столбец существующей таблицы данных. Вот мой текущий код: `for (i in 1: nbNewColumns) ...
У меня проблема с колонками в отношении таблиц данных (по крайней мере, я думаю, что столбцы являются источником моей проблемы). Предположим, у меня есть следующая таблица данных dt: z V1 V2 y 1: a 1 5 ...
У меня есть структурированный фрейм данных (но на самом деле он содержит ~ 400 тыс. Строк): библиотека (data.table) df < - fread ("id end end 174095 2018-12-19 2018-12-31 227156 2018-12-19 2018-12-31 210610 ...
У меня есть data.table, который довольно большой. Я хотел бы сделать некоторую агрегацию только для выбора строк, но используя все данные (т. Е. Не только строки выбора). Вот пример: library (data.table) ...
библиотека (data.table) testvar & lt; - 'A (новая) переменная' testvar% like% 'A (new)' # [1] FALSE testvar% like% '(new)' # [1] TRUE Каков правильный путь использовать% like% operator, и в этом случае первый ...
Я получаю эту ошибку при попытке получить таблицу данных. Есть ли способ решить эту проблему? Ошибка в FUN (X [[i]], ...): ожидаемый sep (','), но новая строка, EOF (или другой непечатаемый символ) завершает поле 0 ...
Хотя есть некоторые подобные вопросы, я не могу найти один ответ, который относится к моему делу в частности. Я просто хочу заменить отсутствующие значения (NA) в моем фрейме данных mydf с минимальным значением ...
Я нашел в data.table package setkey function не сортирует значения символов, такие как base :: sort. Какова логика сортировки символов в setkey, и как я могу сделать setkey и sort ...
У меня есть огромный объект data.table (100 строк по 10 ^ 7 столбцов), который я хочу преобразовать все ненулевые значения в 1. Ниже приводится способ, которым я сейчас это делаю, но преобразовывая в матрицу с этим большим ...
Я хотел бы использовать data.table пакет в R для динамичной генерации агрегирований, но я сталкиваюсь с ошибкой. Ниже, позвольте my.dt иметь тип data.table. пол <-c ("M", "F", "M", "F") возраст <-c (...
У меня есть некоторые data.table, из которого я хочу выбрать случайное подмножество, но только для некоторых операций. Предположим, что данные dat < - data.table (id = 1: 100, group = sample (1: 20,100, replace = TRUE), a = runif (...
У меня есть игрушечный набор данных с отметкой времени и ценой: time < - c (as.POSIXlt ("2017-02-03 09:00:01"), as.POSIXlt ("2017-02-03 09:00 : 03 "), as.POSIXlt (" 2017-02-03 09:00:06 "), ...
В двух наборах данных есть ключевые столбцы ad_set_id.1 (из att1) и ad_set_id из (sp1) (к этим столбцам присоединяются данные) Здесь количество категорий. Например, 23842689912150735 имеет 4 строки > att1 # A ...
У меня есть заданный тип данных AB 1 2 3 4 3 2 2 1 Я хотел бы выбрать строку с максимальным A. Если существует более одной строки с максимальным A, я выберу строку с максимальным B из .. ,
Как наиболее эффективно определить максимальную положительную разницу между значением (X) для каждой строки и последующими значениями той же переменной (X) в группе (Y) в data.table в R. ...