一类错误为α我懂了,但是感觉二类错误不就是取伪吗,取伪不就是接受原假设嘛,那既然拒绝的概率为α,那么”取“的概率不就是1-α吗,那β不就等于1-α嘛,到底是哪里错了呀?
而且解释两类错误的时候为什么要画两个分布然后让它们叠在一起,为什么是两个分布,两个分布分别代表什么呀。原来不就一个分布吗?
一类错误为α我懂了,但是感觉二类错误不就是取伪吗,取伪不就是接受原假设嘛,那既然拒绝的概率为α,那么”取“的概率不就是1-α吗,那β不就等于1-α嘛,到底是哪里错了呀?
而且解释两类错误的时候为什么要画两个分布然后让它们叠在一起,为什么是两个分布,两个分布分别代表什么呀。原来不就一个分布吗?
1、拒绝的反面不是接受,而是不能拒绝;
2、假设检验的核心思想是:小概率事件在一次或者几次试验中发生的概率很小。
假设检验的基本逻辑:
然后根据判断接受或者拒绝原假设。那么这时候就会有一个问题:如果落入拒绝域就一定拒绝原假设吗?显然不是,因为如果拒绝域不代表不会发生,只是说明发生的可能性不大,反过来同样,这就有了第一类错误和第二类错误。所以当第一类错误概率为$\alpha$时,那么第二类错误的概率不会大于$1-\alpha$,因为还要剪去真阳和真阴的部分。
统计是一门非常严格、非常科学的学科。
第一类错误是 P(拒绝H0 | H0为真) = α
第二类错误是 P(接受H0 | H0为假) = β
第一类错误是站在 “P(H0为真)” 这个分布上的
第二类错误是站在 “P(H0为假)” 这个分布上的
很明显这两类错误不是同一个分布。
关于NHST有很多错误的理解,太容易掉坑里了,这篇文章Null Hypothesis Significance Testing: A Review of an Old and Continuing Controversy 有一些讨论。另外这个图例或许也会有帮助 https://rpsychologist.com/d3/nhst/ 。
取伪(第二类)指的是在备择假设成立的情形下,接受原假设,这个时候分布的参数取值于备择假设。
拒真(第一类)指的是在原假设成立的情形下,拒绝原假设,这个时候分布的参数取值于原假设。
为了便于理解,可以认为出现上述两种错的情形对应着两种不同的分布,那么α和β之间就不是简单的能用等式表示的关系。