本楼主今天读到了一份材料,银保监办发〔2022〕2号《中国银保监会办公厅关于银行业保险业数字化转型的指导意见》,主要看了其中的第26条,摘录如下:
(二十六)防范模型和算法风险。建立对模型和算法风险的全面管理框架,制定管理制度,对模型数据的准确性和充足性进行交叉验证和定期评估。审慎设置客户筛选和风险评估等模型的参数,并使用压力情景下的参数进行模拟校验。定期评估模型预测能力及在不同场景下的局限性,确保模型的可解释性和可审计性。模型管理核心环节要自主掌控。加强消费者权益保护,防止算法歧视。
这段文字中有好几个定性的词语,诸如准确性、充足性、局限性、可解释性、可审计性(PS这里我不是想吐槽化力感性度),我的理解是这样的:数据的准确性,是指去掉了误差的真实数据,以及没有经由工具变换、转换或者扭曲过的数据;数据的充足性,是指更加全面的数据,能代表整体,而不仅仅代表局部的数据,视具体情况看需要包含历史而不仅仅是某个时间节点的数据;模型应用场景的局限性,一般的模型都是用历史或现在的数据预测未来,应用场景多受限于数据,不能随意迁移;模型的可解释性,一般应划分为可解释的结果和可解释的过程,具体需要解释到什么程度得看业务需求;模型的可审计性,这一点超出了我的理解能力。
除了“模型的可审计性”我没看懂以外,“使用压力情景下的参数进行模拟校验”这句也没看懂。有没有坛友看明白了的,给俺讲讲啊。