假设检验初步
不错,一如既往地清晰。
关于临界值,我一直觉得它是手工查表时代的产物,那个年代不方便计算P值,只好计算统计量再跟临界值比较,现在统计软件输出P值易如反掌,和0.05或其它alpha值去比较也方便。P值的意义也比临界值直观一些。
关于临界值,我一直觉得它是手工查表时代的产物,那个年代不方便计算P值,只好计算统计量再跟临界值比较,现在统计软件输出P值易如反掌,和0.05或其它alpha值去比较也方便。P值的意义也比临界值直观一些。
一篇脉络清晰、通俗易懂的好文章,统计学就应该这么来写才能让人觉得亲近。
学习了……通俗易懂。
纠结了多年的问题终于明白了~ 非常感谢!
写的很好,非常清晰,谢谢,学习了
把想证明的结论写成备择假设,把想拒绝的结论写成原假设。---why?说的还不是很清楚
[未知用户] 在假设检验中,根据样本数据算出构造的统计量的值落入拒绝域,这是一个小概率事件。如果在一次试验中,上述事件确实发生了,那么我们根据小概率原理(一次试验中小概率事件几乎不可能发生)就有足够的理由拒绝原假设,即我们有足够理由认为备择假设是正确的。反之如果统计量的值没有落入拒绝域,我们只能说不能拒绝原假设,但不能说原假设一定正确。简而言之:假设检验以否定原假设为目标。
不知道这样解释清楚不!
不知道这样解释清楚不!
那个Ho和Ha真有喜感,不懂英文愿意还以为是拟声词
2 个月 后
顿悟
3 个月 后
[未知用户] 我的理解是,首要的原则是谨慎保守,不能轻易接受我们想证明结论的正确性。
(现实生活中,一旦想证明的结论是错的但我们却接受了也许要付出很大代价。比如公司要验证他们的新开发产品提高了性能,从而决定是否投资。如果实际上性能并没有提高,公司却误认为它提高了,那么新产品的投资就很可能血本无归)
因此,我们的目的是要尽可能推翻要验证的结论。但如果在这么严格的标准之下,新结论仍然能经受住考验,那它就显得非常可信了。
于是我们把想拒绝的结论写成原假设,再把原假设为真时我们却错误拒绝的概率设为比如(a=0.05),也就是犯第一类错误拒真的概率只有0.05。通过这样,我们只有很小可能在原假设为真时拒绝原假设。但一旦能拒绝原假设,就说明原假设非常可能为假,而备则假设非常可能为真。
因此,把要拒绝的结论写成原假设是一种很保险稳健的做法。
(现实生活中,一旦想证明的结论是错的但我们却接受了也许要付出很大代价。比如公司要验证他们的新开发产品提高了性能,从而决定是否投资。如果实际上性能并没有提高,公司却误认为它提高了,那么新产品的投资就很可能血本无归)
因此,我们的目的是要尽可能推翻要验证的结论。但如果在这么严格的标准之下,新结论仍然能经受住考验,那它就显得非常可信了。
于是我们把想拒绝的结论写成原假设,再把原假设为真时我们却错误拒绝的概率设为比如(a=0.05),也就是犯第一类错误拒真的概率只有0.05。通过这样,我们只有很小可能在原假设为真时拒绝原假设。但一旦能拒绝原假设,就说明原假设非常可能为假,而备则假设非常可能为真。
因此,把要拒绝的结论写成原假设是一种很保险稳健的做法。
1 个月 后
[未知用户] 假设检验的目的在于拒绝原假设,不在于接受!当没有拒绝时,只能表明没有充分的证据证明原假设不成立!像判断一个人是否犯罪,“法官”总是先假设被告人无罪,如果我们拿出“重要的证据(类似当原假设为真是所得到的样本观测结果或更极端结果),那可以证明被告人有罪。如果我们没有”重要的证据“,那法官只能判”被告人无罪“,但是这并不意味着被告人没有犯罪,只能我们呢没有”重要的证据“证明被告人有罪。这中间会犯两种错误。例如实际中被告人无罪但是被判有罪(这既是弃真错误);实际被告人有罪但是被判无罪(取伪错误)。至于控制那类错误,通常选择哪类后果严重,危害大便控制哪一类。
10 天 后
[未知用户] 嗯,我也觉得P值的意义比临界值更好用。
江堂兄,发现了两个小问题,不知道对不对,呵呵:
1.第二部分:P值,第一段的第二行"那么少比它本身...",其中的“少”字是不是多打了一个字?
2.例子中的均值是25.3还是25.03?好像不统一。
1.第二部分:P值,第一段的第二行"那么少比它本身...",其中的“少”字是不是多打了一个字?
2.例子中的均值是25.3还是25.03?好像不统一。
5 个月 后
[未知用户] 学习了,谢谢!
1 年 后
[未知用户] 一些问题是从来不需要想起,永远也不会忘记,比如这个假设检验白话版。现在找到了一个更大白话的说辞,来自恩格斯、马克思和海涅:
恩格斯说马克思曾经引用过海涅的一句,说,“我播种的是龙种,收获的却是跳蚤”。
移到假设检验的逻辑,就是,如果你播种的是龙种(认为原假设为真),那么你就不太可能收获到跳蚤;但是如果你真的收获到了跳蚤(极端事件),那么就有可能,那东西就不是龙种 (拒绝原假设)。
http://www.jiangtanghu.com/blog/2012/09/16/hypothesis-testing/
6 个月 后
P值小于显著性水平α,拒绝原假设 ? 没理解,为什么P值要和显著性水平比较?
“esteem on 2013/03/25 at 15:37 said: P值小于显著性水平α,拒绝原假设 ? 没理解,为什么P值要和显著性水平比较?”这个我也困惑,同问。
5 个月 后
写的蛮好,通俗易懂!
1 年 后
文章写的太好了,看完理解深刻了很多。
我觉得这个极端事件Q可以这样描述,可能更清晰一点:有一个事件,在“原假设”为真的条件下,它(或者那些比它要极端的事件)发生的概率非常小,那么我们就说该事件是相对于原假设的一个极端事件。也就是说,如果原假设成立,那么该事件就几乎不可能发生。
“如果在原假设为真的情况下,出现了这么一个Q,那我们就有把握拒绝原假设”
对于这句话,我觉得这样说更恰当些:
“我们已经观察到了一个事件S,但是我们发现它对于原假设来说是一个极端事件,它在原假设的条件下几乎不可能出现,所以我们的假设是错误的,所以我们应该拒绝原假设。”
或者“如果在原假设为真的情况下,出现了这么一个事件S,它对于原假设来说是一个Q(极端事件),那我们就有把握拒绝原假设”
因为我觉得不能平白无故地说有个极端事件。因为极端,都必须是相对某个条件下而言的。比如,你说0.9的概率是极端,是因为这是对于一个两面均匀的硬币来说的。比如我可以说,对于一个非常不均匀的硬币来说,投出0.5的概率是极端的。
我觉得这个极端事件Q可以这样描述,可能更清晰一点:有一个事件,在“原假设”为真的条件下,它(或者那些比它要极端的事件)发生的概率非常小,那么我们就说该事件是相对于原假设的一个极端事件。也就是说,如果原假设成立,那么该事件就几乎不可能发生。
“如果在原假设为真的情况下,出现了这么一个Q,那我们就有把握拒绝原假设”
对于这句话,我觉得这样说更恰当些:
“我们已经观察到了一个事件S,但是我们发现它对于原假设来说是一个极端事件,它在原假设的条件下几乎不可能出现,所以我们的假设是错误的,所以我们应该拒绝原假设。”
或者“如果在原假设为真的情况下,出现了这么一个事件S,它对于原假设来说是一个Q(极端事件),那我们就有把握拒绝原假设”
因为我觉得不能平白无故地说有个极端事件。因为极端,都必须是相对某个条件下而言的。比如,你说0.9的概率是极端,是因为这是对于一个两面均匀的硬币来说的。比如我可以说,对于一个非常不均匀的硬币来说,投出0.5的概率是极端的。