如何从图基检验得出首尾计数法则的？

James2238

我在6 Sigma统计工具中学到首尾计数法则，这是判断显著性的一个非常简单的方法，据说源自图基检验。但是我在专业书籍中都没有看到过这个方法，稍微看了一下图基检验方法，也没看懂。

这里肯定有高手，能告诉我如何从图基检验原理得出首尾计数法则的吗？

首尾计数方法如下：

这个测试过程如下：

1. 2组需要测试的参数分别打上标签，如好产品的数据后标G（good），坏产品后标B（bad）。

2. 这2组数据混在一列内，按照从大到小排列（或者从小到大）

3. 当首尾2个数标记一样时（都是好或者坏），就可判断没有显著差异

4. 如果不一样，从顶端数据开始，计数第一次标记变化前的数据的个数，作为顶端计数

5. 从底端数据开始，技术第一次标记发生变化前的数据的个数，叫终端技术

6. 顶端技术和终端技术相加，叫首尾计数，基于显著性差异的假设，首位计数的数值决定置信度。

首尾计数n 置信度

6 90%

7 95%

10 99%

13 99.9%

从上表可以得出，当有6个或以上的首尾计数时，2组数据的显著性差异的置信度在90%以上，我们可以按照不同的应用场合（发现线索或者验证）确认，这是一个重要线索，或者有显著改善。这个方法如此简单，甚至适合现场操作人员使用。

yihui

这种几十年前的扳手指头算P值的方法在现在不学也罢，计算机这么方便了，为啥还要用近似的方法呢，除非是研究历史的……

你大可以用模拟的方法验证一下他的方法。

James2238

楼上小看了这类东西。我确实在收集质量统计工具发展史一类的资料，本人是个工厂的工程师，6 Sigma黑带，对统计理论只有皮毛认识，在培训中才知道t检验之类的概念，甚至图基检验也看不懂。对于工程应用来说，最好能在生产实验现场用手指头就能做出决定来，工人也能看懂，这样的工具才是好工具。具体 p值是0.01或是0.02是不重要的，只要得出有显著性差异或是没有的结论（通常以0.05做判断）。休哈特发明SPC后，到英国游学，英国的统计学界都不待见他。但是就是如此简单的东西帮助美国日本成为工业强国。图基检验的理论学术价值也许不高，但它奠定了6 Sigma运动的一部分理论技术基础，帮助许多世界级公司的技术突破和管理创新。

很高兴有这样的论坛，更希望人大的统计学同学能在建好象牙塔，同时在应用上也有突破。

yihui

难道现在搞6 sigma的人都不用学统计学理论么……看来我误会6 sigma了……

我个人从来都是不是象牙塔学派，正好相反，我是应用优先于理论的。但不管你做什么应用，如果理论没通，用起来到处都是陷阱，统计学兼具科学和艺术，我认为提供一些粗略的手指头原则也无妨，但这些原则在有更好的条件的时候应该放弃。就像计算机半秒钟能画出来的Q-Q图，就没必要拿着尺笔在概率纸上描点了。统计的易用性当然很重要，理论不是专为数学家准备的。其实我也是Tukey的大粉丝，不过这并不意味着我认为他的每一种方法都有用。

我说了这个问题可以计算机模拟验证一下，我专挑了个Weibull分布（寿命数据常服从的分布），结果和Tukey的经验相去甚远，下图是t检验和Wilcoxon检验的P值与Tukey计数的对照。

[attachment=201991,94]

话说回来，连统计学专业的人都还在学习一些30年代的纸笔计算技巧，等到工业界更新统计知识就不知道是什么时候了。

附模拟R代码：

set.seed(402)<br />
n = 30<br />
tukeyTest = data.frame(t(replicate(10000, {<br />
    x1 = rweibull(n, runif(1, 0.5, 4))<br />
    x2 = rweibull(n, runif(1, 1, 5))<br />
    c(t.test(x1, x2)$p.value, wilcox.test(x1, x2)$p.value, with(rle(rep(0:1,<br />
        each = n)[order(c(x1, x2))]), ifelse(head(values, 1) ==<br />
        tail(values, 1), 0, sum(lengths[c(1, length(lengths))]))))<br />
})))<br />
colnames(tukeyTest) = c("t.test", "wilcox.test", "count")<br />
png("tukeyTest.png", width = 500, height = 500)<br />
par(mar = c(4.5, 4, 2, 0.1))<br />
with(tukeyTest, {<br />
    boxplot(t.test ~ count, at = unique(count) - 0.2, col = rgb(1,<br />
        1, 0, 0.5), xlim = c(min(count) - 1, max(count) + 1),<br />
        xaxt = "n", xlab = "Tukey Count", ylab = "P-values",<br />
        notch = TRUE, boxwex = 0.5)<br />
    boxplot(wilcox.test ~ count, at = unique(count) + 0.2, add = TRUE,<br />
        col = rgb(0, 1, 0, 0.5), xaxt = "n", notch = TRUE, boxwex = 0.5)<br />
    axis(1, unique(count))<br />
})<br />
dev.off()<br />

</p>