[未知用户] 益辉兄的解释很有道理。以我的看法,二项分布的GLM经常使用的link function有三种logit=log(p/(1-p)),prohit=[latex]{\Phi}^{-1}(p)[/latex],complementary log-log=log(-log(1-p))。logit是二项分布GLM的canonical link,与后两个link function的共同之处就是他们都是单调的且自变量在[0,1]内取值。而二项分布GLM下E[Y]=p,p是一次实验中目标事件成功的概率,因此E[Y]=g(eta)就要求连接函数必须满足单调且在[0,1]内取值。logit用的较多,一是因为他的数学性质,另外一点嘛,大胆地猜测一下是因为多数的统计或计量软件在做二项GLM回归时把logit做为默认的link,然后就越来越流行了。统计被称为处理数据的艺术,所谓艺术自然少不了主观的因素在其中了,二项GLM的link选择也体现了这一主观。
从线性模型到广义线性模型(1)——模型假设篇
[未知用户] 比如,你可以看看Jeffrey Wooldridge 的Econometric Analysis of Cross section and Panel Data. 在社会科学中,将X看成非随机变量是无法被接受的。例如,在著名的估计消费倾向的的回归方程中,你没有理由将消费看成随机变量而认为收入是非随机的。
[未知用户] 这个我理解,它也是我多年的疑问。统计学把X当作非随机的这在大多数情况下都不合理,除了试验设计,没有什么地方存在非随机的自变量(即使是试验设计,因素的水平也未必真的是非随机的)。把自变量当成非随机的,会有很大的数学处理上的方便;否则,模型将会变得恶心。
你能大致说说怎么处理吗?谢谢!
你能大致说说怎么处理吗?谢谢!
遗憾的是,将x看成随机时只能讨论估计量的渐近性质,如:在一定条件下OLS的一致性、渐近正态性等。有机会我也介绍一下计量经济学中的处理方法。另外,请教一下,在评论中如何输入公式呢?
[未知用户] 将X视为随机的,那我们建模所用的数据,比如X的样本值,应该怎么利用呢?用它们来估计X的分布或参数吗?。。。。计量方面我不熟悉,期待你的文章^_^。
[未知用户] 公式参见写作注意事项之三: http://cos.name/2008/11/how-to-work-with-cos/
1 年 后
用英文自学的GLM,感觉基本功不够扎实,对基本概念理解还不深入.看了您的文章,感觉强化了概念!谢谢!