dagga
看到很多文献在用多元统计的方法(如多元回归等)时,都先进行单因素分析,其目的何在,难道只是对变量进行筛选在进行多因素分析吗?那如果自变量的数目在样本的允许的范围之内,还有必要进行单因素分析吗?请指教,谢谢
yihui
没有必要,不知道这个招数是谁发明的。
dagga
国内许多医学文献中都是这样做的,不解,但找不到理由
losttemple
我是这样理解的,单因素有意义的变量再进入多因素分析,由于入选的变量少,在某种程度上减少了发生"共线性"的可能。
neige
when you want to build a model, thats how you start.... "bi"variate first
thats how forward stepwise regression works
br1229
个人认为没有必要,国内也有部分统计学老师持相同观点,直接利用model的变量筛选即可
vivian840618
我认为没有必要,不知道是什么道理
robustreg
因为变量间关系的复杂性,不是纯理论模型规定出来的那么完美,对一个复杂问题的认识,先要从最基本的分析开始,可以提供用于构建最终模型的有用信息,而且可初步验证一些专业上的实际意义以利于将来复杂模型的建立。
实际做数据分析的时候,一定切记不要一上来就写出一个复杂的大模型来吓唬人,要从最简单的开始慢慢细心作。就像我们做个简单的均数比较,拿到数据要先看看单变量的分布,简单的统计描述等等,然后再来方差分析等等模型,所以,单因素分析我认为是必要的,不是某些情况下必要,而是通常都必要。
BTW:软件中现成model的变量筛选,基本上是令统计建模变成傻瓜式操作的简单粗暴方法,主要是可以令非专业者愉快地得到可能错误的结论
shenbaise
[quote]引用第7楼robustreg于2007-07-17 06:26发表的“”:
因为变量间关系的复杂性,不是纯理论模型规定出来的那么完美,对一个复杂问题的认识,先要从最基本的分析开始,可以提供用于构建最终模型的有用信息,而且可初步验证一些专业上的实际意义以利于将来复杂模型的建立。
实际做数据分析的时候,一定切记不要一上来就写出一个复杂的大模型来吓唬人,要从最简单的开始慢慢细心作。就像我们做个简单的均数比较,拿到数据要先看看单变量的分布,简单的统计描述等等,然后再来方差分析等等模型,所以,单因素分析我认为是必要的,不是某些情况下必要,而是通常都必要。
BTW:软件中现成model的变量筛选,基本上是令统计建模变成傻瓜式操作的简单粗暴方法,主要是可以令非专业者愉快地得到可能错误的结论[/quote]
同意~~
hexm26
neige不是说的很清楚了吗?Automatic variable selection procedures 里面主要分forward selection,backward selection和 stepwise selection 三种,分别对应如何选择变量的标准。事实上,model selection的争议很大,除了上面3种以外,还有很多其它的方法,但它们主要的区别就在增加或是减少变量的标准不同。很多意义上来说,model selection是个以经验和试验目的为标准的方法,而非纯统计解决的问题。
huang20052
众说纷纭,我以为由单因素到多因素,符合人们认识事物的方式:由简单都复杂。程序设计上的模块化思维也正是基于这样的出发点,分割分析,分割成不同的模块,从各个不同的局部了解事物,然后再到全局。同样的,对于复杂的医学问题,不能用单纯的一两个因素就能说明全部的原因,要在长期的医学实践当中不断认识疾病的各个影响因素。耐心、反复的推敲多因素模型是必须进行的工作。