Susannalsy 请教caret包中,运用随机森林方法,在训练模型时,令importance=TRUE和不加这一句,得到的模型中都可以看到importance。不加的话:只有一列,表头叫overall;加这一句:有四列,分别是自变量对二分类的两个变量的重要性、MeanDecreaseAccuracy、MeanDecreaseGini;请问,这两种有什么区别啊,而且加和不加这一句,虽然固定了种子,用的留一法,模型精度结果都不一样,更加搞不懂了。
Susannalsy https://stackoverflow.com/questions/63224935/why-does-the-importance-parameter-influence-performance-of-random-forest-in-r 终于查到了这个importance参数等不等于TRUE对这个精度的影响原因,大家可以参考这个回答,这个问题不仅存在于caret包里,也存在random forest()里,当等于TRUE时,又引入了额外的随机数生成器,所以会增加随机点,导致这两个模型本身就不一样了。 如果有大神懂这方面,可以继续指教!