正态分布的概率密度函数定义域为实数域,但很多情况下研究的问题是正数范围内的,比如某个班上同学的身高。在这种情况下说某个正数域上的变量服从正态分布,从理论上看似乎不是很严格。
对正态分布的一点疑惑
我的理解,首先是标准化得问题。此外如果身高来自无限总体,服从正态分布,负的身高也是正确的(在数学上),但是没有意义的(实际情况)。不知道对不对。
回复 第2楼 的 acode:标准化不能将一个(0,+∞)上的分布变成是(-∞,+∞)上,取对数可以,不过就失去对称性了。
使用截断分布啊。
回复 第1楼 的 catfish:你恐怕想成标准正态发布了。中心不在0处就可以了啊
很多时候可能是对数正态分布的。
回复 第5楼 的 jiao_taishan:呵呵,中心在不在原点都改变不了其定义域为(-∞,+∞)。
回复 第4楼 的 oliyiyi:很多时候直接就对不可能取到负值的数据进行正态性检验了,然后当做正态分布处理了。
回复 第8楼 的 catfish:在一个年龄段,其平均身高应该是存在的,那么每个人相对于该平均身高的差值就可以看做是长高时候的误差了..假设该误差符合正态分布,然后根据某班这个样本构建统计量进行假设检验,完成对原分布假设的推断,看起来没有什么问题呀
觉得楼上的说的很不错,把数据变换一下,换个角度想
因为描述身高的这个分布的绝大部分的概率都落在了正数上,对于小于0的那部分就忽略了,不影响结果
我赞同9楼的意见[s:11]
其实9楼的意思就是,这是一个以样本均值作为分布中心的正态分布,相当于从原点右移了。显然取-∞与+∞都没有实际意义,但是事实上根据正态分布的密度函数,取到非常偏离中心的那些点概率小到可以忽略
回复 第13楼 的 Tracy X:是的,这是理论向现实屈服的典型例子。理论上正态分布显然不能用来拟合身高这种有界的数据的。