all
本人新手,现有几百土壤检测结果,其中肯定有一些数据是异常的,请问怎么剔除掉(用3S法),请问怎么写sas程序??????????
非常感谢!
rtist
居然毫无道理的做法还有个名字。。。晕。
all
人家是新手啊,不懂就问啊,希望有人指点啊,谢谢
rtist
我的意思是根本就不该这么删,这根篡改数据没什么区别。
all
楼上的,那该怎么办,比如某指标的数据比常规大很多该怎么剔除,请教了,搞不懂您说的意思
kuhasu
hahahahaha~
yihui
这问题讨论过很多遍了:慎重对待所谓的“异常值”!如果数据可以随意删改,那统计分析没有任何存在的意义。
引用一句Joke就是:I'm not an out-lier; I just haven't found my distribution yet!!!
首先要考察数据的来源,看数据的所谓“异常”究竟是“错误观测”还是“真实观测”,如果本身就是错误的观测值,那么但删无妨;怕就怕删掉了真实的异常值。
如果只要是异常值就得删除,那么是不是这世上出类拔萃的人都得拉出来砍掉?考试得100分的同学都得被赶出学校?这都是一个道理。
至于“如何剔除”,这是在确保道德原则的前提之下的执行工作——告诉计算机你的指令,它自然替你执行。
sos_sas
先分析异常数据产生的原因:
1. 业务上有无特定含义;
2. 数据录入错误等等
业务上有特定含义的,需要特别分析。录入错误可作修正,如极值控制等