如何 Estimate linear models

LouisaCC

Estimate all possible linear models with two predictors and interaction. Use half your data. That is, regress y on the intercept only. Then regress y on x1. Then regress y on x2. Then on x1 and x2. Then on x1*x2, then on x1 and x1*x2, etc. This should result in 8 different models. All models have an intercept, but the first has only the intercept. Note: if you type formula('y~X1*X2') this will be expanded to 'y~X1+X2+X1*X2'. You need to use 'y~I(X1*X2)' to avoid this behavior.
用两个预测因子和相互作用估计所有可能的线性模型。使用您的数据的一半。也就是说，只在截距上回归y。然后在x1上回归y。然后在x2上回归y。然后是x1和x2。然后在' x1x2 '上，然后是' x1 '和' x1x2 '等等，这将导致8个不同的模型。所有的模型都有一个截距，但第一个只有截距。注意:如果你输入“公式(y~X1X2)”，那么它将被扩展到“y~X1+X2+X1X2”。你需要使用“y~I(X1*X2)”来避免这种行为。

请各位大神给几个栗子

之前的data code：
#1.

generate.lm <- function(n, beta, sigma = 1){
if (length(beta) < 1)stop("beta cannot be empty")
if (sigma < 0)stop ("SD not non-negative")

epsilon = rnorm (n, 0, sigma)
X = t(sapply(1:n, function (i)runif (length(beta), -10,10)))
y = X %*% (beta) + epsilon
  
U = data.frame (y,X)
return(U)
}

#2.

set.seed(0000123456) ## replace with your UID
n = 400
beta = c(5,0)
dat = generate.lm(n, beta)
## more code needed

Heterogeneity

ryo 我在回复楼主的问题时，着眼点是

LouisaCC Estimate all possible linear models with two predictors and interactions.

而不是这些模式是不是有真实的经济学意义。
另一方面，对于lm(y~x1*x2)即 $y=\beta_0+\beta_1 x_1+\beta_2 x_2+\beta_3 x_1 x_2$ ，利用你的例子，我可以解释为广告打得好促进了销售；广告打得越多，那么单位销售成本的投入不仅带来 $$beta_1$$ 的营业额提升，而且由于广告抢占了潜在客户的心智，每单位的销售成本还额外实现了 $$beta_3 x_2$$ 的营业额。

我不是很懂混合模型。

Heterogeneity

假设你的数据集是MyData,内含因变量y和两个自变量x1、x2。

summary(lm(y~1, data=MyData))
summary(lm(y~x1, data=MyData))
summary(lm(y~x2, data=MyData))
summary(lm(y~., data=MyData))
summary(lm(y~x1:x2, data=MyData))
summary(lm(y~x1+x1:x2, data=MyData))
summary(lm(y~x2+x1:x2, data=MyData))
summary(lm(y~x1*x2,data=MyData))

ryo

Heterogeneity
怎么解释呢？lm(y~x1+x2+x1:x2)中的coef，我会 y = x1 + x2，不过就不晓得 x1:x2中的coef！怎麼運用...

假设y＝营业额，x1＝销售成本，x2＝广告费用。那么营业额＝销售成本＋广告费用。

但是相互作用中的x1:x2是解释为x2组中的x1的相互作用，那麼和mixed model中的lme(y~x1+x2, random=(x1|x2))有什麼分別？。

不过x1+x2！已經解釋為x1和x2每添加一個單位會帶來多少營業額。

ryo

例子：

子女身高 ~ 88.06 + 0.20 x 父母平均身高 - 55.02 x 男性 + 0.38 x 父母平均身高 x 男性

女孩身高 ~ 88.06 + 0.20 x 父母平均身高

男孩身高 ~ 88.06 - 55.02 + （0.20 + 0.38）x 父母平均身高

以上例子是有因子，不过如果多个自变量都是数值的话，怎么诠释相互作用。

比方说：

lm(y~x1 *x2 * x3)

y = 截距 + x1每添加一個单位

y = 截距 + x2每添加一個单位 + (x1:x2)

y = 截距 + x3每添加一個单位 + (x1:x3) + (x2:x3)

这样诠释对吗？

Heterogeneity

ryo 我没太看懂你比方说的这一部分……看看有没有大神过来点拨一下吧。

ryo

Heterogeneity 看了一下https://stats.stackexchange.com/a/47501/68357，大意了解一下

ryo

UNDERSTANDING 3-WAY INTERACTIONS BETWEEN CONTINUOUS VARIABLES
我参考了以上文章，有三个问题。

Result <- lmer(Y ~ X*Z*W, random =(1|PPX), data=Matrix)

怎么诠释3项相互作用
怎么把混合型模型加入计算
predict()函数与forecast()的分别，怎么通过predict()预测；然后 predict(new.data)怎么运用？

ryo

R LME4 mixed models with nesting and nesting-interactions
以上钳套模型是另一个模型，希望大神们可以指点。