一类错误为α我懂了,但是感觉二类错误不就是取伪吗,取伪不就是接受原假设嘛,那既然拒绝的概率为α,那么”取“的概率不就是1-α吗,那β不就等于1-α嘛,到底是哪里错了呀?

而且解释两类错误的时候为什么要画两个分布然后让它们叠在一起,为什么是两个分布,两个分布分别代表什么呀。原来不就一个分布吗?

    Tingwei 是一个分布族中的两个分布,也就是说这两个分布是同一个类型的(例如:都是正态分布、t分布等),但是参数不同(例如:均值不同),假设检验验的是统计量是不是服从该参数的分布!

      CMCai0104 我可能还是不太懂,就是H0分布和H1分布具体是什么,就是,我们一般说身高呈什么什么分布,温度呈什么什么分布,但是H0和H1不是个真假问题吗,假设我的H0是小明身高为182,那H0分布指什么呀?什么叫"小明身高为182"呈什么分布

        CMCai0104 就是H0为真的时候的分布到底是个什么样的分布,怎么画出来的呀,参数是什么呀

        Tingwei

        一类错误是 “假阳性”,二类错误是“假阴性”。用身高举例的话,

        我们知道海拔跟身高有正相关,h0:南方人平均身高170cm,标准差5cm。北方 平均180,标准差5cm。南方人小明身高182cm,北方人小北身高170cm

        统计推断的目的是用小明的身高来判断小明来自南方还是北方。可以看出,小明越高,南方人可能性越小而北方人可能性越大。我们把南方人作为原假设h0,北方人作为备择假设h1。你选择了“身高高于180的不是南方人”作为你的分类器模型,那么这个模型将会把小明分类为“不是南方人”,犯了一类错误;把小北分类为南方人,犯了二类错误。

          Tingwei

          1、拒绝的反面不是接受,而是不能拒绝;
          2、假设检验的核心思想是:小概率事件在一次或者几次试验中发生的概率很小。

          假设检验的基本逻辑:

          • 首先根据原假设构造统计量(例如:均值、方差等);
          • 根据假设条件推断出统计量的分布;
          • 根据分布以及设定的p值查表确定拒绝域;
          • 判断统计量是否落入拒绝区域。

          然后根据判断接受或者拒绝原假设。那么这时候就会有一个问题:如果落入拒绝域就一定拒绝原假设吗?显然不是,因为如果拒绝域不代表不会发生,只是说明发生的可能性不大,反过来同样,这就有了第一类错误和第二类错误。所以当第一类错误概率为$\alpha$时,那么第二类错误的概率不会大于$1-\alpha$,因为还要剪去真阳和真阴的部分。

          统计是一门非常严格、非常科学的学科。

            6 天 后

            第一类错误是 P(拒绝H0 | H0为真) = α
            第二类错误是 P(接受H0 | H0为假) = β
            第一类错误是站在 “P(H0为真)” 这个分布上的
            第二类错误是站在 “P(H0为假)” 这个分布上的
            很明显这两类错误不是同一个分布。

              4 天 后

              Fye 这个图真的好棒哈哈,很帮助理解,谢谢你哦!感谢!

              tctcab 谢谢!我之前是抽样分布那里没有仔细看,所以可能总是搞混数据本身的分布和统计量分布。谢谢回答

              7 个月 后

              取伪(第二类)指的是在备择假设成立的情形下,接受原假设,这个时候分布的参数取值于备择假设。
              拒真(第一类)指的是在原假设成立的情形下,拒绝原假设,这个时候分布的参数取值于原假设。
              为了便于理解,可以认为出现上述两种错的情形对应着两种不同的分布,那么α和β之间就不是简单的能用等式表示的关系。