tzhang
本求助同时放在人大经济论坛,如果已经在那里阅读过,请跳过本贴以节省您的时间。
在一篇文章中看到要检验power law distribution的规范的方法,首先是用maximum log-likelihood estimate进行参数估计,然后进行bootstrap analysis,接下来进行K-S test,最后是test against real alternatives (这个到现在都没弄清楚是怎么回事)。这四个步骤是我在阅读查找了大量的资料之后(整整一个星期就没干别的事,汗,自己的效率也够低的),领域内专家一致认为算是对power law distribution进行检验最为严密规范的方法步骤了。
到这里就有问题了,步骤放在那里,可是如何检验又是另一个问题。我再又折腾了一个星期后,彻底不能自己搞定了,特上来请教大牛们则个。
我对R知之甚浅,也是因为spss难以满足这些分析的需要才开始学的,期间也多次转回spss,因为R实在太难学了(对我来说,呵呵)。但最终因为spss功能有限,还要依靠R。所以对于上面的四个步骤,哪为大侠可否对我指点一二,我感觉象在吃刺猬一样,实在不知道从哪里下口。
为了节省各位大虾的时间,我需要的信息主要包括,执行这些功能需要R的哪些packages,以及这些包里的哪些函数,剩下的我可以自己慢慢摸索。也就是说我想知道我应该从哪里开始入手,当然这也是最难的地方,感谢各位的指点。
另外哪为可以告诉我test against real alternatives 是个怎么回事吗?我已经困惑了n久了。
yihui
“要检验power law distribution的规范的方法”中的“规范”是什么?(英文)
可否稍微写一下数学表达式,恕我鲁钝,实在没太明白检验的目的。首先应该是有一个幂律分布对吧?然后通过类似回归的方法求参数,然后为了检验参数稳定性再用Bootstrap,随后用KS检验拟合优度,到最后那一步我也不明白,是不是检验一个有显式的备择假设?比如备择假设是服从另一个分布。都是瞎猜的,请楼主明示。
P.S. 这个提问的形式很规范,可以作为模范帖:)
tzhang
对对,不愧是专业人士,呵呵。
我谓规范的意思就是比较好的检验是否power law分布的方法,是相对于一般的学者在验证power law的时候仅仅拟合出一条log-log直线来讲的,不知道这里用规范是否合适,呵呵。
我想验证的正是您所提的幂律形式,最简单的就是y=a*x^b,^表示x的b次方,一般b是负数,-b称之为幂律指数。呵呵,估计这些您都知道,我只是为了想把问题说明得更清楚一些。
按照您刚才说的,想请教前三步如何在R中进行验证。因为做到前三步已经是一个比较好的验证了,第四步是锦上添花,可以以后慢慢添,呵呵。
谢谢了。
yihui
一、取对数,回归,lm
二、可以用boot包,也可以自己写个简单的程序,bootstrap就是有放回的抽样,sample(n,n,replace=T)
三、ks.test