Я пытаюсь использовать библиотеку ks для расчета 95% домашнего диапазона для групп в наборе данных. Проблема заключается в том, что значения "перерыва", которые определяют отсечение для контуров 95%, отличаются между ...
У меня есть data.frame с координатами x, y и переменной группировки: df < -data.frame (group = c (rep (1,3), rep (2,3), rep (3,3)), x = c (rep (c (1,2,3), 3)), y = c (1,2,3,1,4,9,1,8,27)) ...
У меня есть данные панели временных рядов в R (организованные по стране-году), и я пытаюсь добавить переменную к фрейму данных, которая подсчитывает количество наблюдений, равное «1» в двоичной переменной для каждого ...
Изменить: только что понял, что боковой столбец в данных вообще не используется, поэтому, пожалуйста, не обращайте на него внимания в целях примера. У меня есть большой массив данных по баскетболу, играющий за игрой, и я хотел бы ...
Я пытаюсь сгенерировать новые столбцы в таблице из результатов функции, которая принимает в качестве входных данных несколько существующих столбцов этой таблицы плюс данные пользователя В качестве упрощенного примера я хотел бы использовать ...
Я пытаюсь создать новый столбец со значениями, полученными из исходного графика. Я хотел бы сначала рассчитать среднее по группе для того же отеля и той же даты, а затем использовать средние по этой группе для деления ...
У меня есть фрейм данных (tibble) с несколькими строками, каждая строка содержит IDNR, дату начала, дату окончания и статус экспозиции. IDNR является символьной переменной, дата начала и окончания являются переменными даты ...
У меня есть корреляционная матрица, созданная с помощью corr < - cor (data, use = "pairwise.complete.obs"). Я использовал этот код для получения данных в длинном формате и фильтрации корреляций> 0,1: corr% >% ...
У меня есть список data.frames (в этом примере только 2): set.seed (1) df1 < - data.frame (id = sample (LETTERS, 50, replace = T), val = rnorm (50), val1 = rnorm (50), stringsAsFactors = F) df2 < - data ....
У меня есть два кадра данных A и B, с 40k и 110k наблюдениями по одной и той же переменной, ID. Я хочу создать C, то есть все строки, которые находятся в A, но не в B и не на пересечении. Попытка ответа < - ...
У меня есть следующие ссылки, успешно очищенные, и я хочу создать цикл for. Таблица, которую я очищаю, распространяется на 3 страницы, таким образом, векторы whip_2018a, whip_2018b и whip_2018c: ...
Я пытаюсь добавить новый столбец с именем «класс» к моим данным на основе условий столбцов. Я создал пользовательскую функцию, называемую class_fun, чтобы создать этот новый столбец. Я пытаюсь установить все под ...
Я хотел бы рассчитать среднее эвклидовое расстояние между каждым элементом и всеми другими элементами в группе в рамках фрейма данных. Я бы хотел сделать это в течение tidyverse, но, похоже, не может заставить его работать ...
Я пытаюсь применить пользовательскую функцию в пакете dplyr. Данные & amp; библиотека функций (tidyquant) (dplyr) Ra & lt; - c ("AMZN", "FB", "GOOG", "NFLX")% & gt;% tq_get (get = "stock.prices", ...
Когда я выбрал значение NA здесь данные [data == "na"] & lt; - NA data [! Complete.cases (data),] я должен заменить его, но в зависимости от типа распространения. При использовании Shapiro.test распределение по переменным ...
Я хотел бы выполнить kmeans внутри групп и добавить к моим данным информацию о номере и центре кластера, которым было назначено наблюдение (все же, внутри групп, поэтому кластер 1 не совпадает с ...
Я пробовал различные варианты (и искал вокруг), но я просто не могу реплицировать эту функциональность SQL в R. Это пример моего фреймворка данных и проблема, которую я пытаюсь решить: tbl & lt; - read ....
Я пытаюсь вычислить среднее значение по группам, но оставив собственную группу наблюдения. Мои данные выглядят так: library (dplyr) df & lt; - tribble (~ year, ~ country, ~ value, 2001, "France", 150, ...
Я пытаюсь получить условную сумму двух разных столбцов в моем тибете. Ниже приведен пример воспроизводимого примера моей проблемы. Библиотека (tidyverse) # Данные для быстрой визуализации # wave ...
У меня была проблема, пытаясь ответить на вопрос. Я получил этот вектор с большими числами: large1 & lt; - c (2016052016051062331, 2016062016061017838, 2016052016051062331, 2016052016051062402, ...
Я пытаюсь перенести мое понимание plyr в dplyr, но не могу понять, как группировать по нескольким столбцам. # сделать данные со странными именами столбцов, которые не могут быть жестко запрограммированы data = data.frame (...
Я новичок в R, я пытаюсь подсчитать количество субъектов (рядов), которые принимают конкретное лекарство (ключевое значение) в любой из множества моментов времени (столбцы). Поскольку есть много столбцов, я хотел бы проверить на ...