Я пытался понять, как работает аргумент subset
в функции R lm()
. Особенно мне кажется сомнительным следующий код:
data(mtcars)
summary(lm(mpg ~ wt, data=mtcars))
summary(lm(mpg ~ wt, cyl, data=mtcars))
В каждом случае регрессия имеет 32 наблюдения
dim(lm(mpg ~ wt, cyl ,data=mtcars)$model)
[1] 32 2
dim(lm(mpg ~ wt ,data=mtcars)$model)
[1] 32 2
. однако коэффициенты меняются (вместе с R² ). В справке не так много информации по этому вопросу:
subset an optional vector specifying a subset of observations to be used in the fitting process