rainywh269 我从事的项目是临床医学相关的,目前希望通过积累的大量病人临床检测数据(生理指标)对某特定疾病的发生进行预测建模。 所面临的问题是:不同的实验试剂测量得出的参考区间不同,即对相同的数值具有不同的阴/阳性解释。而如果采用分类属性,信息丢失很严重,所以希望仍然使用数值属性。 那么如何将在同一批数据(一样的试剂与实验条件)上训练好的模型移植应用到其他医院测量出的数据上呢?在数据预处理的时候可以做些怎样的data normalization有效解决这个因为reference range不同带来的问题呢?