yukuang
粗糙集属性约简(大意描述:有一张普通的二维表T,表的最后一列D的内容是前面几列或前面全部列计算出来的,这种表应该叫决策表。有时,并不是所有的列都对决策有用,可能存在很多列是无用的,不影响最终结果D的。这时需要将这些不重要的列去掉,或者选择出重要的列。)时,针对海量数据,网上有一种算法,通过随机抽取表中的子集,对子集进行约简(这时由于数据量小,可以采用普通的现有的约简算法),计算子集中列的权重。多次执行上述过程后,根据各列的权重排序,找出重要的列。1、这种方法算不算蒙特卡罗算法?2、另外,上述对列的抽样,每次抽样都是独立的,效率不高,能否改进一下?我是这么想的,下一次抽样时利用本次或前一次或前多次的抽样结论,争取本次能更多地随机抽到权重较高的列?3、重要性抽象或马尔科夫蒙特卡罗(MCMC)算法是否能解决这个问题?
多谢各位高手了。