Я хочу вычислить среднее
(или любую другую сводную статистику длины один, например min
, max
, длина
, сумма
) числовой переменной («значение») на каждом уровне группирующей переменной («группа»).
Сводная статистика должна быть назначена новой переменной, которая имеет такую же длину , что и исходные данные . То есть каждая строка исходных данных должна иметь значение, соответствующее текущему значению группы - набор данных должен , а не быть свернутым до одной строки на группу. Например, рассмотрим группу означает
:
До
id group value
1 a 10
2 a 20
3 b 100
4 b 200
После
id group value grp.mean.values
1 a 10 15
2 a 20 15
3 b 100 150
4 b 200 150