stata-biostata 新华网刚发布了一个关于学生冬季长跑的调查结果(于2009年4月27日13:52访问),一共调查了100人,结果中却出现了92.79%这样的比例数字,有常识的读者都知道,世上不存在0.79个人,因此这里面必然有某个地方是错的(姑且不妄言造假)。这则消息让我马上想起《统计陷阱》这本书,我们生活中有多少陷阱呢? 我认为不能说这个结果就是错的。我们需要考虑一个问题,100个人中可能有没有应答的。此时的分母就不是100了。所以说新华网漏了一些信息。
yihui 谢谢你的提醒。 如果再用文中的方法进一步算算,0.9279是如何得来的呢?1到100的数字中,只有13/14和90/97与0.9279最接近,不过前者是0.9286,后者是0.9278,还是对不上,因此100以内找不到可能产生92.79%这个结果的分式。
yihui [未知用户] 当然可以直接进位啊,那么权当0.9279是90/97得来的,然后随便在报导内再找一个数字,比如79.44%,很快又会发现只能是27/34(0.7941176)或者58/73(0.7945205),此时四舍五入还是直接进位是不是都不行了呢?如果还有数字舍入的规则,那么我们可以再找一个比例数字看看。 这让我想起一句话,撒谎容易圆谎难。
shuaihuang 可能新华社的人咨询了几位高深莫测的高人 他们一致觉得这个调查的方差太大 所以要加一个correction for bias or variance 这样的话,小数点就出来了 又基于人民群众普遍不懂统计 就没有介绍这一段...
priss111 谢老大,忒牛了,怎么一连串能记得来那多“0.9279是90/97得来的,然后随便在报导内再找一个数字,比如79.44%,很快又会发现只能是27/34(0.7941176)或者58/73(0.7945205)” 数字呢。 佩服,佩服。 发完了,发现多了两个字,有点不通顺。