• 综合主站
  • 从线性模型到广义线性模型(1)——模型假设篇

区看一下新的计量经济学教材,x现在都被看成随机的了
[未知用户] 给个例子呗,我去看看计量如何处理随机的X。但愿不是用那“万能”的结构叉叉模型。

个人认为把X当随机变量将会给统计模型带来魔鬼……
[未知用户] 随着期望改变,方差也跟着改变,这对指数分布族中的很多分布都适用(除了正态分布),比如Poisson、Gamma等等,方差是期望的函数。这是因变量的分布的问题,和用什么联接函数无关。

为什么用Logit联接函数,我是觉得这个问题不必过度解释,找理由找着找着容易变得牵强。Logit联接函数是二项分布对应的正则联接函数(Canonical),本来是图个数学性质方便而已。

你说的患病率解释当然有一定道理,但感觉还是有点“事后解释”的味道,我不知道它是否真的那么直观。你说的“效率远远低于”大概是根据优比(Odds Ratio,OR)得来的,前者OR上升了1.24倍,后者上升为2.11倍。但这一定是用logit的证据吗?用log[p^2/(1-p)]行不行呢,它也有这个性质;当然可以,没有人规定联接函数一定得长什么样子。我这显然有点狡辩的意思,但本意是统计里面很多东西本不应该成为金标准,而在流传过程中无意成为了标准,并且人们给这些标准添加越来越多的解释,就像心理学上的自我暗示、自我说服一样。
[未知用户] 嗯,写这个文章前,我大致翻看了一些国内作者写的计量教材,多数都把x写成X,认为随机变量。但是我又翻看了几个国外作者写的教材,当然是统计学方面的,都把x写成x,即认为是fixed constant,而不是随机变量。把x看成随机的,我不知道原因何在。也许您能给我指点一二。
[未知用户] 益辉兄的解释很有道理。以我的看法,二项分布的GLM经常使用的link function有三种logit=log(p/(1-p)),prohit=[latex]{\Phi}^{-1}(p)[/latex],complementary log-log=log(-log(1-p))。logit是二项分布GLM的canonical link,与后两个link function的共同之处就是他们都是单调的且自变量在[0,1]内取值。而二项分布GLM下E[Y]=p,p是一次实验中目标事件成功的概率,因此E[Y]=g(eta)就要求连接函数必须满足单调且在[0,1]内取值。logit用的较多,一是因为他的数学性质,另外一点嘛,大胆地猜测一下是因为多数的统计或计量软件在做二项GLM回归时把logit做为默认的link,然后就越来越流行了。统计被称为处理数据的艺术,所谓艺术自然少不了主观的因素在其中了,二项GLM的link选择也体现了这一主观。
[未知用户] 比如,你可以看看Jeffrey Wooldridge 的Econometric Analysis of Cross section and Panel Data. 在社会科学中,将X看成非随机变量是无法被接受的。例如,在著名的估计消费倾向的的回归方程中,你没有理由将消费看成随机变量而认为收入是非随机的。
[未知用户] 这个我理解,它也是我多年的疑问。统计学把X当作非随机的这在大多数情况下都不合理,除了试验设计,没有什么地方存在非随机的自变量(即使是试验设计,因素的水平也未必真的是非随机的)。把自变量当成非随机的,会有很大的数学处理上的方便;否则,模型将会变得恶心。

你能大致说说怎么处理吗?谢谢!
遗憾的是,将x看成随机时只能讨论估计量的渐近性质,如:在一定条件下OLS的一致性、渐近正态性等。有机会我也介绍一下计量经济学中的处理方法。另外,请教一下,在评论中如何输入公式呢?
[未知用户] 将X视为随机的,那我们建模所用的数据,比如X的样本值,应该怎么利用呢?用它们来估计X的分布或参数吗?。。。。计量方面我不熟悉,期待你的文章^_^。
[未知用户] 公式参见写作注意事项之三: http://cos.name/2008/11/how-to-work-with-cos/
1 年 后
用英文自学的GLM,感觉基本功不够扎实,对基本概念理解还不深入.看了您的文章,感觉强化了概念!谢谢!