TTG
我按教科书上题目做了一个三因素全因子的的析因方差分析,数据有部分是删失的,是一个非平衡的实验设计。
直接将原始录入数据框,其中x1是数值,x2,x3分别是因子,并把缺失部分x1值定为NA,然后做了
summary(aov(Y~x1+x2+x3+x1*x2+x1*x3+x2*x3+x1*x2*x3,data=xxx))
但是得到的F值和P值与标准答案有不小的出入
请问我直接这样使用aov有无问题,如果有的话,这种情况下用什么函数好呢?
谢谢。
rtist
数据不平衡的时候,有很多种方法进行检验,SAS把这个叫Type I~IV。
其实数学上讲,每一种都是合理的。
所以最可能的原因是,教科书中和R中用了不同的分解。
可以额外参考car包中的Anova函数。
数据平衡的时候,所有方法的都得结果都是一样的,所以不存在这个问题。
TTG
谢谢,我明白了,难怪R-help上有人问什么TYPE-3呢。
rtist
比较容易忽视的问题是,R和sas关于type几的定义还不一样。。。
leffgh
你们说的教科书是什么书?
TTG
[quote]引用第3楼rtist于2007-08-27 11:20发表的“”:
比较容易忽视的问题是,R和sas关于type几的定义还不一样。。。[/quote]
这么复杂,在哪可以查到R中不同type的适用情况呢?
TTG
[quote]引用第4楼leffgh于2007-08-27 20:23发表的“”:
你们说的教科书是什么书?[/quote]
人卫颜虹主编的八年制医学统计学。
rtist
[quote]引用第5楼TTG于2007-08-28 08:31发表的“”:
这么复杂,在哪可以查到R中不同type的适用情况呢?[/quote]
本来就没有定论的东西。只能说是个别情况下个别人对个别type情有独钟。
我一般倾向于R的typeII,SAS的typeIII。
我觉得一种可能的解决方案是,对于所有非平衡设计都用预测分布的随机数进行多重插补,这样补充成平衡数据,然后方差分解的时候就没有type几的问题了,最后把所有每个插补的结果再综合在一起得到最终的结果————I never tested/proved this idea before, but others might have done this. Use at your own risk. 不知道楼主有没有兴趣尝试一下这个思路啊?
rtist
[quote]引用第6楼TTG于2007-08-28 08:32发表的“”:
人卫颜虹主编的八年制医学统计学。[/quote]
你也是学医的??
TTG
[quote]引用第8楼rtist于2007-08-28 21:48发表的“”:
你也是学医的??[/quote]
是的,我是学临床医学的,您是也学医的么?
rtist
[quote]引用第9楼TTG于2007-08-29 02:50发表的“”:
是的,我是学临床医学的,您是也学医的么?[/quote]
曾经是
TTG
从临床改而学统计的,很辛苦啊。
您也知道,像我们这样的,对统计深入点的东西简直门外汉,学校也只教点sas,敷衍了事。以后有不懂的,还请您多多指教。