1
ответ

Перестановка строк данных в зависимости от фактора

У меня есть фрейм данных, например: буквенное значение класса A 0 55 B 1 23 C 1 12 D 1 9 E 2 68 F 2 78 G 2 187 Я хочу повторно ...
вопрос задан: 18 January 2019 13:49
1
ответ

Как передать значения разрыва в stat_contour по фасету или группе

Я пытаюсь использовать библиотеку ks для расчета 95% домашнего диапазона для групп в наборе данных. Проблема заключается в том, что значения "перерыва", которые определяют отсечение для контуров 95%, отличаются между ...
вопрос задан: 17 January 2019 16:18
1
ответ

Возврат списка функций с помощью dplyr

У меня есть data.frame с координатами x, y и переменной группировки: df < -data.frame (group = c (rep (1,3), rep (2,3), rep (3,3)), x = c (rep (c (1,2,3), 3)), y = c (1,2,3,1,4,9,1,8,27)) ...
вопрос задан: 17 January 2019 14:20
1
ответ

Как создать переменную в данных временных рядов, которая считает число 1 в другой переменной для каждого уникального значения года

У меня есть данные панели временных рядов в R (организованные по стране-году), и я пытаюсь добавить переменную к фрейму данных, которая подсчитывает количество наблюдений, равное «1» в двоичной переменной для каждого ...
вопрос задан: 17 January 2019 07:37
1
ответ

Можно ли объединить суммирование с summarise_at в одном group_by с dplyr

Изменить: только что понял, что боковой столбец в данных вообще не используется, поэтому, пожалуйста, не обращайте на него внимания в целях примера. У меня есть большой массив данных по баскетболу, играющий за игрой, и я хотел бы ...
вопрос задан: 16 January 2019 22:57
1
ответ

создание новых столбцов Tibble на основе сопоставления плюс пользовательские данные

Я пытаюсь сгенерировать новые столбцы в таблице из результатов функции, которая принимает в качестве входных данных несколько существующих столбцов этой таблицы плюс данные пользователя В качестве упрощенного примера я хотел бы использовать ...
вопрос задан: 16 January 2019 22:22
1
ответ

метки оси X в барплоте и расширение кадра данных

Мои данные df < - структура (list (variable = c ("main.tmin", "main.tmin", "main.tmin", "main.tmin", "main.tmin"), coef = c (- 23.28653023, 22.98726658, -55.1958095, -...
вопрос задан: 16 January 2019 19:46
1
ответ

Разделение значений в каждой ячейке на среднее по группе в R

Я пытаюсь создать новый столбец со значениями, полученными из исходного графика. Я хотел бы сначала рассчитать среднее по группе для того же отеля и той же даты, а затем использовать средние по этой группе для деления ...
вопрос задан: 16 January 2019 18:03
1
ответ

Разбейте строки, представляющие длинные интервалы времени, на несколько строк

У меня есть фрейм данных (tibble) с несколькими строками, каждая строка содержит IDNR, дату начала, дату окончания и статус экспозиции. IDNR является символьной переменной, дата начала и окончания являются переменными даты ...
вопрос задан: 16 January 2019 15:15
1
ответ

Поиск дубликатов по двум столбцам

У меня есть корреляционная матрица, созданная с помощью corr < - cor (data, use = "pairwise.complete.obs"). Я использовал этот код для получения данных в длинном формате и фильтрации корреляций> 0,1: corr% >% ...
вопрос задан: 16 January 2019 11:32
1
ответ

Соединение фреймов данных без возврата всех соответствующих комбинаций

У меня есть список data.frames (в этом примере только 2): set.seed (1) df1 < - data.frame (id = sample (LETTERS, 50, replace = T), val = rnorm (50), val1 = rnorm (50), stringsAsFactors = F) df2 < - data ....
вопрос задан: 16 January 2019 02:57
1
ответ

Неверный результат для левого соединения [дубликат]

У меня есть два кадра данных A и B, с 40k и 110k наблюдениями по одной и той же переменной, ID. Я хочу создать C, то есть все строки, которые находятся в A, но не в B и не на пересечении. Попытка ответа < - ...
вопрос задан: 15 January 2019 19:19
1
ответ

мутировать данные с помощью линейного уравнения

У меня есть к вам технический вопрос: lonlon < - c (3.581667, 3.146667, 3.256667, 2.860000, 3.473333, 2.981667, 3.465000, 2.703333, 3.521667, 3.320000, 3.196667, 3.961667, 3.686667, 3.305000, ...
вопрос задан: 15 January 2019 16:12
1
ответ

Прогноз: список длины 3 не имеет смысла при расчете MAPE в R

В этих данных временные ряды = структура (список (Данные = структура (c (10L, 14L, 18L, 22L, 26L, 29L, 32L, 35L, 38L, 1L, 4L, 7L, 11L, 15L, 19L, 23L, 27L, 30L , 33л, ...
вопрос задан: 15 January 2019 15:37
1
ответ

Создание цикла for из нескольких ссылок для создания одной таблицы, используя ссылки ESPN для нескольких сезонов / лет

У меня есть следующие ссылки, успешно очищенные, и я хочу создать цикл for. Таблица, которую я очищаю, распространяется на 3 страницы, таким образом, векторы whip_2018a, whip_2018b и whip_2018c: ...
вопрос задан: 14 July 2018 01:39
1
ответ

если выражение в сгруппированных данных

Я пытаюсь добавить новый столбец с именем «класс» к моим данным на основе условий столбцов. Я создал пользовательскую функцию, называемую class_fun, чтобы создать этот новый столбец. Я пытаюсь установить все под ...
вопрос задан: 14 July 2018 01:03
1
ответ

Вычислить среднее эвклидовое расстояние между элементами внутри групп

Я хотел бы рассчитать среднее эвклидовое расстояние между каждым элементом и всеми другими элементами в группе в рамках фрейма данных. Я бы хотел сделать это в течение tidyverse, но, похоже, не может заставить его работать ...
вопрос задан: 14 July 2018 00:40
1
ответ

Применение функции в `mutate ()` от `dplyr`

Я пытаюсь применить пользовательскую функцию в пакете dplyr. Данные & amp; библиотека функций (tidyquant) (dplyr) Ra & lt; - c ("AMZN", "FB", "GOOG", "NFLX")% & gt;% tq_get (get = "stock.prices", ...
вопрос задан: 13 July 2018 20:37
1
ответ

Как сгруппировать dimnames xtab и мутировать на основе значений в таблице?

Предположим, у меня есть xtab (построенный как последний шаг в конвейере dplyr), который выглядит так: treatPer treatGrp 0 1 0 7.2 8.4 1 6.3 9 ....
вопрос задан: 13 July 2018 18:20
1
ответ

Замена NA в зависимости от типа распределения пола в R

Когда я выбрал значение NA здесь данные [data == "na"] & lt; - NA data [! Complete.cases (data),] я должен заменить его, но в зависимости от типа распространения. При использовании Shapiro.test распределение по переменным ...
вопрос задан: 13 July 2018 13:47
1
ответ

Мутация в рамке вложенных данных

Я хотел бы выполнить kmeans внутри групп и добавить к моим данным информацию о номере и центре кластера, которым было назначено наблюдение (все же, внутри групп, поэтому кластер 1 не совпадает с ...
вопрос задан: 13 July 2018 13:44
1
ответ

Правильный порядок элементов для плотного ранга в пакете dplyr

Я пробовал различные варианты (и искал вокруг), но я просто не могу реплицировать эту функциональность SQL в R. Это пример моего фреймворка данных и проблема, которую я пытаюсь решить: tbl & lt; - read ....
вопрос задан: 13 July 2018 13:35
1
ответ

Множественное вменение, разделенное группой

В моем примере данных data = structure (list (groupvar = c (1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 1L, 1L, 2L, 1L, 2L, 1L), v1 = c (27L, 52L, 92L, 86L, ​​NA, ...
вопрос задан: 13 July 2018 12:53
1
ответ

выберите NA obs в dataframe в R

Скажем, это мои данные data = structure (list (x1 = structure (c1L, 7L, 2L, 8L, 4L, 5L, 11L, 9L, 3L, 6L, 10L), .Label = c ("1270", " 14130 "," 2030 "," 29910 "," 310 "," 3160 "," 570 "," 620 "," 7520 "," 960 "," na "), ...
вопрос задан: 13 July 2018 12:17
1
ответ

Средний по строкам, но оставляя собственную группу [duplicate]

Я пытаюсь вычислить среднее значение по группам, но оставив собственную группу наблюдения. Мои данные выглядят так: library (dplyr) df & lt; - tribble (~ year, ~ country, ~ value, 2001, "France", 150, ...
вопрос задан: 8 March 2016 15:20
1
ответ

Сумма в dplyr, дающая (что я ожидаю) count [duplicate]

Я пытаюсь получить условную сумму двух разных столбцов в моем тибете. Ниже приведен пример воспроизводимого примера моей проблемы. Библиотека (tidyverse) # Данные для быстрой визуализации # wave ...
вопрос задан: 11 February 2016 21:11
1
ответ

Назначение дневных званий с пропущенными днями [дубликат]

У меня есть временной ряд в моем наборе данных: ts & lt; - c («2014-12-02», «2014-12-02», «2014-12-03», «2014-12-03», «2014» -12-03 "," 2014-12-05 "," 2014-12-05 "," 2014-12-05 "," 2015-01-01 "," 2015-01-01 "," 2015-01 -03" ...
вопрос задан: 9 December 2015 22:30
1
ответ

Сильное поведение с большими числами в R [дубликат]

У меня была проблема, пытаясь ответить на вопрос. Я получил этот вектор с большими числами: large1 & lt; - c (2016052016051062331, 2016062016061017838, 2016052016051062331, 2016052016051062402, ...
вопрос задан: 3 September 2015 07:05
0
ответов

Группировать по нескольким столбцам в dplyr, используя строковый вектор

Я пытаюсь перенести мое понимание plyr в dplyr, но не могу понять, как группировать по нескольким столбцам. # сделать данные со странными именами столбцов, которые не могут быть жестко запрограммированы data = data.frame (...
вопрос задан: 16 June 2019 11:11
0
ответов

Подсчет количества строк, в которых значение встречается хотя бы один раз во многих столбцах

Я новичок в R, я пытаюсь подсчитать количество субъектов (рядов), которые принимают конкретное лекарство (ключевое значение) в любой из множества моментов времени (столбцы). Поскольку есть много столбцов, я хотел бы проверить на ...
вопрос задан: 18 April 2019 19:50