BFY
小白求教,做课程论文的时候使用glmnet包中的elastic方法做logistic分类的时候,直接使用glmnet的predict得到的测试集准确率非常高。而将glmnet降维以后的变量提取出来,用提取的变量使用glm或者brglm包做logistic分类的时候,得到的测试集分类效果就特别差。。。有木有大神告知一下原因,是glmnet做predict的时候使用了什么特殊的方法吗?
lxs0202
个人感觉异常高的准确率可能是数据集的问题,有没有cross validate? 是不是出现了over fit? 模型建好后,predict方法中感觉不会有什么特殊的优化
BFY
[未知用户]
谢谢你!因为我后面是用glmnet选出的变量做的logistic.也就是说我在选变量的时候已经做了CV啦。。不过我看了一下之前的论文,在考虑是不是lasso的压缩让logistic的beta估计量更接近无偏,所以可以取得更好的效果。