我也不大赞同就这么把离群值删掉。数据来看是不同方面体能的测试,五十米跑测爆发力,一千米测耐久力,坐位体前屈测柔韧度。衡量的体能各不相同甚至负相关都有可能:比如可以想象某些同学及其擅长长跑而冲刺不行,具体可查红肌,白肌区别。总之, 异常值分布在不同样本里是很正常的嘛。
具体统计技术问题的话,我觉得楼主描述的问题可能是 “按箱线图剔除了50米离群值的样本,结果坐位体前屈的离群样本剔除掉之后五十米的箱线图又改变了,出现了新的离群值…”
如果非得去离群值,个人建议是先标记任意单项离群样本,统一去除有标记的样本。