RyanPCH 2009年10月10日发布 #1 2009年10月10日星期六 12点24分 我们都知道标准正态分布的mean是0,variance是1. 可是我不知道它的原因?为什么一定是0 & 1,不是其它数字? 有谁可以指点/有相关资料吗?
RyanPCH 2009年10月11日发布 #4 2009年10月11日星期日 20点23分 [quote]引用第1楼谢益辉于2009-10-11 03:43发表的 : 这就是定义。 [/quote] 定义?我从一本书看到能够通过证明来证明这个定义是对的?
yuanxn 2009年10月12日发布 #6 2009年10月12日星期一 06点01分 A 首先如果数据是正态分布的 B 其次数据经过标准化的过程 (1、一切数据被均值减因此此后均值为0,2、此后数据被原先标准差除,导致新标准差为1) 这样的正态分布就是标准正态的 可是你可能换会问为什么分布一定是正态的,等等..................
yuanxn 2009年10月12日发布 #7 2009年10月12日星期一 06点08分 古典统计学中对正态分布有一种“拜物教”或者叫“泛正态”误区,现在大学的统计课造就的学生相当的比率的人没逃出“泛正态主义”,“泛高斯主义”的误区
yuanxn 2009年10月12日发布 #8 2009年10月12日星期一 08点16分 对于任何数据(正态或非正态)的标准化处理的直接目的在于 1. 减均值后,坐标系原点在既是均值 2. 数据分布曲线积分为1 (这就可以考察概率了) 但是其意义不仅在于此,因为这样一来任何数据放在标准化的坐标系中它们之间的比较,就不是个数据之间外部特征的比较了(大象是按吨算的,蚊子是按毫克算的,人的身高是按米算的,油按公升算的),完全是数据各自内部特性之间的差异比较。 数据标准化之后,给我们一个讨论平台,对比不同数据分布间的差异。这一点很重要,统计学中很多关于分布差异的检验的想法就是来自这里。 以后学到的卡方检验和KS(“亲嘴检验”-----科尔莫格罗夫-斯米尔诺夫检验)都和分布的比较有关。可以说标准化是分布比较的基础。 标准化正态的分布,是一种标准化和理想化数学模型,其功能相当于物理学中的“理想气体”,我们从实际生活中未必有“理想气体”,但是特殊的气体的很多特性却可以通过“理性气体”模型推得。实际生活中未必能顺利抽得正态数据,只是近似正态或非正态的,我们通过数据变换这个哈哈镜,使得数据曲线尽可和标准正态接近,这样做就可以做统计推断。原始数据和标准正态在X轴上分布的尺度是不同的,每点上概率密度不同,但是既然知道数据变换的函数,就可以从正态检验中的临界点反推知原始数据的临界点何在。 说到这里有人可能会问,既然实际抽得到数据不是正态的,那么我们为什么非要利用正太分布来讨论非正太数据呢?这个想法很好,可是大千世界分布形式是无限多的,非典型的分布也要一个个讨论就是有一万个高斯也要吐血的。在一个城市中有各种道路通向目的,有人行道、马路、小胡同等等,借助于正态分布,如同乘坐地铁。但是在利用正态时千万要审视纳入观察的数据和正态在分布上是否近似,不近似就要考虑变换。
RyanPCH 2009年10月12日发布 #9 2009年10月12日星期一 22点31分 通过微分它的pdf,或则利用moment generating function,我们可以在证明E(X)=0和Var(X)=1,不是吗?
yuanxn A 首先如果数据是正态分布的 B 其次数据经过标准化的过程 (1、一切数据被均值减因此此后均值为0,2、此后数据被原先标准差除,导致新标准差为1) 这样的正态分布就是标准正态的 可是你可能换会问为什么分布一定是正态的,等等..................
yuanxn 对于任何数据(正态或非正态)的标准化处理的直接目的在于 1. 减均值后,坐标系原点在既是均值 2. 数据分布曲线积分为1 (这就可以考察概率了) 但是其意义不仅在于此,因为这样一来任何数据放在标准化的坐标系中它们之间的比较,就不是个数据之间外部特征的比较了(大象是按吨算的,蚊子是按毫克算的,人的身高是按米算的,油按公升算的),完全是数据各自内部特性之间的差异比较。 数据标准化之后,给我们一个讨论平台,对比不同数据分布间的差异。这一点很重要,统计学中很多关于分布差异的检验的想法就是来自这里。 以后学到的卡方检验和KS(“亲嘴检验”-----科尔莫格罗夫-斯米尔诺夫检验)都和分布的比较有关。可以说标准化是分布比较的基础。 标准化正态的分布,是一种标准化和理想化数学模型,其功能相当于物理学中的“理想气体”,我们从实际生活中未必有“理想气体”,但是特殊的气体的很多特性却可以通过“理性气体”模型推得。实际生活中未必能顺利抽得正态数据,只是近似正态或非正态的,我们通过数据变换这个哈哈镜,使得数据曲线尽可和标准正态接近,这样做就可以做统计推断。原始数据和标准正态在X轴上分布的尺度是不同的,每点上概率密度不同,但是既然知道数据变换的函数,就可以从正态检验中的临界点反推知原始数据的临界点何在。 说到这里有人可能会问,既然实际抽得到数据不是正态的,那么我们为什么非要利用正太分布来讨论非正太数据呢?这个想法很好,可是大千世界分布形式是无限多的,非典型的分布也要一个个讨论就是有一万个高斯也要吐血的。在一个城市中有各种道路通向目的,有人行道、马路、小胡同等等,借助于正态分布,如同乘坐地铁。但是在利用正态时千万要审视纳入观察的数据和正态在分布上是否近似,不近似就要考虑变换。