dj0403
rt,sample 很大,
本人是新手,请高手们指点,
yihui
残数?残差?residual?
dj0403
对,residual ,多谢纠正
yihui
既然要算残差,就不可避免要算y的估计值,回归的那个矩阵运算也就不可避免(除非用别的形式的回归),这样其实也很难说有什么“快速”的计算方法,只能一步步来。
你的sample究竟有多大?
dj0403
n=1078
hexm26
proc reg data=_indata;
model y = x1 x2;
output out=_outdata r=resid;
run;
在数据_outdata里,resid就是你想要的Residual,样本数1078并不大,很快就可以得到结果。
dj0403
你好,我现在使用了cook's distance statistic 通过图像得到了残差的相关情况,但是我如果要对目前的regression进行调整 ,下一步是否应该发现具有undue influence 的observation然后把这些都从sample中删除掉,这个过程该如果做呢,如何找出存在问题的obervation.多谢
hexm26
说实话,从样本中删除所谓的“有问题”的观测点是非常慎重的,一般而言,不要轻易的删除任何一个观测点,不管你用的检测变量有多“科学”,或是多么的Significant。如有可能,和数据的提供者讨论,或是对数据进行透彻的了解,这样的删除才有保障;否则,保留每一个观测点。就统计工作者而言,个个数据都是金!
这里我不给你提供具体的方法;如果你是出于学习的目的,自己去查书吧,相关的内容应该很多。
dj0403
你好,我的各个varibles,都是通过调查问卷的形式反馈而来,是社会科学方面的工作,目前由于某些observation,影响了整体的结论。这个时候我应该如何做呢,多谢
hexm26
某些observation,影响了整体的结论,所以你就要删除它?
呵呵,用数据编故事没有编出想要的结果,就要动屠刀?(这里我用“编”字没有任何贬义,因为我知道做经济研究和社会调查常用的分析方法。)建议楼主考虑一下你的数据的性质,以及你用的统计方法(斗胆说一句,你用Simple Regression十之八九是不合适的),这样会对你的研究更有帮助。
longoR
同意九楼的。除非能说明来自另外一个总体,否则不能删除。如果删除也要把来自那个总体的所有观测值都删除。
检查cooks'D等等influence measure是为了发现问题,而不是用来制造没有问题的假象。