Tingwei 我想问两个问题: t分布看的是样本均值的抽样分吧,还是其他统计量。 书本上有这么一句话,“设X1,X2,...,Xn为从某一总体中抽出的随机样本,X1,X2,...,Xn为互相独立且与总体有相同分布的随机变量”。这里的n应该指的是一个样本中的容量,也就是一个样本的大小。但是书上定义中心极限定理时有这么一段话: ”中心极限定理(central limit theorem):设从均值为μ、方差为 σ2 (有限)的任意一个总体中抽取样本量为 n 的样本,当 n 充分大时,样本均值 的抽样分布近似服从均值为 μ、方差为 σ2/n的正态分布“。”中心极限定理要求 n 必须充分大,那么多大才叫充分大呢?这与总体的分布形状有关。总体偏离正态越远.则要求 n 越大。然而在实际应用中,总体的分布未知。此时,我们常要求 n>=30。顺便指出,大样本、小样本之间并不是以样本容量大小来区分的。在样本容量固定的条件下所进行的统计推断、问题分析,不管样本容量有多大,都称为小样本问题;而在样本容量 n→∞的条件下进行的统计推断、问题分析则称为大样本问题。一般统计学中的 n>=30 为大样本,n<30 为小样本只是一种经验说法”。 在这段话中很明显,n指的也是样本容量,即一个样本的容量,一个样本的大小,而不是指抽样次数。 但是你看中心极限定理的定义,说的是样本均值的抽样分布啊,就一个样本哪里来的样本均值的抽样分布啊,样本均值的抽样分布应该指固定一个样本容量,然后按照这个样本容量抽很多很多次样本,每次抽样的均值才能形成一个抽样分布啊。但是中心极限定理明明说的就是n充分大,也就是样本容量无限大,也就是一个样本的大小足够大的时候,并不是说n是多次抽样啊,这跟后半句的样本均值的抽样分布有什么关系吗?
khou 说的是你每次抽样,都有n=30的样本容量,你这么抽样无限次(每次抽n=30),你可以得到一个distribution,这个distribution会接近一个\(\mu, \sigma^2 / 30\) 的正态分布。n越大,越接近。 一个样本确实没有分布,但是这个样本服从抽样分布。就像抛一次硬币要么是正要么是反,但是它服从,正1/2,反1/2的分布。
Jonie_Y 说的是你每次抽样,都有n=30的样本容量,你这么抽样无限次(每次抽n=30),你可以得到一个distribution,这个distribution会接近一个\mu, \sigma2 / 30μ,σ2/30 的正态分布。n越大,越接近。 准确来说,是每次抽一个30的样本,抽好m个样本量为30的样本,每个样本求均值,得到m个均值,这m个样本均值会接近一个……,而不是“这个distribution”会接近一个…… khou Tingwei
yianyian5 我在本科阶段遇到的抽样分布通常都是利用样本得到的某个统计量的分布。对于一个固定的样本,这个统计量是一个确定的值。但是抽样的随机性导致了这个统计量的随机性,所以它也有自己的分布。这个分布肯定和样本容量n有关系,那你让分布的密度函数里的n逐渐变大,那么n越大密度函数越接近正态分布的形状。