fengqiao
有很多自变量,且有些存在很强的共线性,我想精简变量,但是step之后仍不能满足要求,应该怎么办呢?
snoopyzhao
PCR, PLS 或者岭回归吧……
redlou
variable selection 是一个热点专题啊,特别是在high dimensional data analysis,
有很多新的方法( lasso, group lasso, elastic net, SCAD...)
wentrue
[quote]引用第0楼fengqiao于2009-03-27 17:12发表的“如何筛选变量”:
有很多自变量,且有些存在很强的共线性,我想精简变量,但是step之后仍不能满足要求,应该怎么办呢?[/quote]
可以考虑用PCA或SVD降维处理,去除相关性,得到主要信息
dingpeng
R的包lars 提供了LASSO
neowangtao
penalized likelihood approaches
sure independence screening