Microhimalaya 在做分类问题的有的是有要检验Featre对于分类是否有帮助。这时候一般需要进行独立性经验。 检验类别和Feature之间是否是独立的。 当类别只有2类的时候可以用秩检验和KS检验之类。 但是当类别出木超过2的时候,大家是怎么检验的,有什么好的方法吗?
nan.xiao 从没做过这样的检验 。。。 假设检验的要求太严格了,独立不代表就对分类完全没有帮助,不独立不代表对分类有很大帮助。何况只能在拒绝原假设时说二者不独立,但是在不能拒绝原假设时,却不能说二者相互独立。再者,这样做完全忽略了变量之间的交互作用。 我觉得“对分类是否有帮助”的评测最好是和分类器本身的理论捆绑在一起的。
nan.xiao 回复 第3楼 的 Microhimalaya: 有些简单的分类器可能也没自带。不过单独做特征评估的方法是存在的,只不过一般不会从传统的假设检验这个角度做罢了。比如 CORElearn::attrEval 中给出的 40 多种指标。FSelector 包也给出了若干。 再扩展一点就是 Feature Selection 这个大话题的范畴了。水很深啊 。。。