sailinggray
用SPSS 可以做出 箱图,可以出现离群值和极端值 但是不知道这个方法是不是就可以判断是异常值。
或者还有其它什么方法?
离群值(箱图/探索). 值与框的上下边界的距离在 1.5 倍框的长度到 3 倍框的长度之间的个案。框的长度是内距。
极端值(箱图). 值距离框的上下边界超过 3 倍框的长度的个案。框的长度是内距
yihui
“异常”其实不是统计学概念,需要人为定义:你觉得怎样的值算是异常值
至于剔除,只要知道了“异常”的标准当然就好办了。
sailinggray
谢谢。
yiyishou
楼上正解.我补充一点我知道的常见的说法.
在回归模型诊断里面,一般称预测值与实际值的偏差为"残差",残差有几种表示方法:标准化残差, 学生化残差等等,按照需要取一种残差,再按照某种标准取一个阀值来限定异常点,只要那个点的残差大于阀值,就可以认为它是异常点。