Karoom
我看一本社会调查方面的书,里面定义方差为S^2=sum(x-_x)/n,而我在数理统计中看到是
S^2=sum(x-_x)/(n-1), "_x"表示平均值,n表示样本容量
为什么会有不同定义的?哪位能跟我解释一下
wipm
后者是无偏估计
你随便找本统计教材看看就知道了
Karoom
后面那个我知道,我想问的是前面的为什么要那样定义,而且不只一本书那样定义
wxqmath
1、你的公式里少了平方。这一定要注意!
2、第一个公式是一个自然的想法,是样本离差平方和的平均值,叫样本方差。可以作为总体总体方差的估计量。其实她就是总体方差的矩估计量。
3、但是人们发现这个估计量是有偏的,所以做了修正,就得到了第二个定义,严格的名称叫做修正样本方差,是总体方差的无偏估计量。
4、大样本情况下两个没有多大区别。
5、如果总体期望u已知,要估计总体方差,那么你把第一个公式中的样本平均值_x改成u,可以得到一个新的统计量,这种情况下用她估计总体方差比你的第二个公式还要好。
明白了吗?
robustreg
社会统计,,,,有点软,软科学,写出来的东西也软
Karoom
Thank you very much!!
comny
有n的是plug-in估计值,maximum likelihood estimator几乎都是这样的形式
第二个是unbiased估计值
两个都有用,或者都是很常用的