happySB 我看网上大多数介绍的是,Lasso回归的结局变量如果是分类变量的话,一般是二分类0或1,我想知道如果结局分类变量是0,1, 2的话,可以用Lasso回归吗。我想利用Lasso回归来初步筛选,避免过度拟合,然后进行多因素的竞争风险分析来确定相关危险因素,这个方法是否可行?
fenguoerbian happySB lasso是回归系数的正则项,跟你本身是什么回归模型关系不大(当然,我这里是说一般总是可以计算的,而不是说统计性质上的影响不大) 三分类就是个多项回归呗,glmnet里已经帮你写好了。
nan.xiao 简单的解法如楼上所述,在 glmnet 里使用 family = "multinomial" 即可。我来列几个开放式问题吧: 这里的 0, 1, 2 是否有顺序信息存在。如果有,那是否最好使用 ordinal regression。 如果把多分类响应转化成几个二分类响应,可以转化成一个 multi-task binary classification 问题,这样模型不会像 multinomial 那么复杂,每个任务选出来的变量也更容易解释。 这里更大的问题其实是方法学上的,因为这样分两阶段建模本质上是 double dipping,简单说就是先用数据生成了一个假设,又在同样的数据上测试这个假设,当然会呈现一种效果很好的假象。
meeeeeeeeo nan.xiao 这里更大的问题其实是方法学上的,因为这样分两阶段建模本质上是 double dipping,简单说就是先用数据生成了一个假设,又在同样的数据上测试这个假设,当然会呈现一种效果很好的假象。 第三点有点看不太明白,大佬有更详细的说明或者资料吗
fenguoerbian meeeeeeeeo 应该是指在同样的数据上,先选出了重要变量,然后后面还有一个多因素竞争风险分析。极端一点就像是线性回归里先用lasso选了变量,然后就用同样的数据和选出来的变量跑个回归说这些系数都是统计显著的。