大家好,我有一组数据,想检查每个数据是否与改组数据有区别。但是我的数据整体可能不是正态的,该采用什么检验方法呢??
非正态数据如何进行单样本检验
样本量够大就好,根据中心极限定理,只要样本量够大,样本呈正态分布
回复 第2楼 的 ilikewjb:我的样本量够大,不过我的不是随即样本,所以不是正态的。我的问题是,如果不是正态,用什么方法进行单样本分析?
回复 第3楼 的 yqx1985:不是随机没关系啊,只要每一个样本相差不大是可以忽略的,并不需要完全的相互独立。如果你觉得不放心,可以用非参数中稳健估计得方法。
比如说M估计以及对位置参数的稳健估计。
回复 第5楼 的 ilikewjb:你老扯那么远干啥?就直接回答用什么方法解决非正太数据的单一样本t检验就得了
回复 第6楼 的 yqx1985:恩 从非参数的思想看,可以用中位数检验。
回复 第6楼 的 yqx1985:你老跑这里来问问题干啥?直接看一万本书去不就得了?
回复 第2楼 的 ilikewjb:这种说法似乎从盘古开天辟地的时候就有了,可惜是严重的误解。很多人总是说“样本量大就能让样本服从正态分布”,但这并不是中心极限定理(CLT)说的事情,CLT说的是样本均值(或者严格来说,是随机变量之和除以某个标准化因子——参见Lindeberg条件)在样本量趋于无穷的时候会依分布收敛到正态分布。样本本身是什么分布,与样本量无关。我本科的时候学CLT有人也是抱有这种错误的想法,当时我举的一个傻例子就是,如果样本来自一个退化分布,比如只能取值1,那么一万个1也能服从正态分布?
回复 第9楼 的 谢益辉:当年王星老师就为这事挂过人[s:13]
回复 第9楼 的 谢益辉:可能我说的并不准确,但是我觉得如果样本只能取一个值的话(比如说只能取1),那就没有必要放到概率中讨论了。其实我想说的是,样本本身什么分布并不重要,只要样本之间是独立同分布,或者是样本与样本之间不独立,但是要几乎一样的大小(似乎是林格贝格条件,身边没书忘记了)。其样本和的统计量是满足正态分布的。比如说样本是x(i),当满足中心极限定理时其样本和(即样本的卷积分布)y=x(1)+x(2)+。。。。+x(n)是正态分布的,但是由于样本卷积分布y方差随着样本的增多而扩大,所以人们往往用样本均值来表示中心极限定理。
回复 第11楼 的 ilikewjb:嗯,你这样说就不容易引起误会了。
Lindeberg条件的大意是那些独立的随机变量之和的方差中,尾巴贡献的方差和总的方差相比,随着n增大而趋于0。一般常见的分布都满足这个条件,那些尾巴特别厚的分布(典型的如柯西分布)可能会不满足。