什么是“模型的可审计性”？

yuanfan

本楼主今天读到了一份材料，银保监办发〔2022〕2号《中国银保监会办公厅关于银行业保险业数字化转型的指导意见》，主要看了其中的第26条，摘录如下：

（二十六）防范模型和算法风险。建立对模型和算法风险的全面管理框架，制定管理制度，对模型数据的准确性和充足性进行交叉验证和定期评估。审慎设置客户筛选和风险评估等模型的参数，并使用压力情景下的参数进行模拟校验。定期评估模型预测能力及在不同场景下的局限性，确保模型的可解释性和可审计性。模型管理核心环节要自主掌控。加强消费者权益保护，防止算法歧视。

这段文字中有好几个定性的词语，诸如准确性、充足性、局限性、可解释性、可审计性（PS这里我不是想吐槽化力感性度），我的理解是这样的：数据的准确性，是指去掉了误差的真实数据，以及没有经由工具变换、转换或者扭曲过的数据；数据的充足性，是指更加全面的数据，能代表整体，而不仅仅代表局部的数据，视具体情况看需要包含历史而不仅仅是某个时间节点的数据；模型应用场景的局限性，一般的模型都是用历史或现在的数据预测未来，应用场景多受限于数据，不能随意迁移；模型的可解释性，一般应划分为可解释的结果和可解释的过程，具体需要解释到什么程度得看业务需求；模型的可审计性，这一点超出了我的理解能力。

除了“模型的可审计性”我没看懂以外，“使用压力情景下的参数进行模拟校验”这句也没看懂。有没有坛友看明白了的，给俺讲讲啊。

SungManhin

感觉对于“新兴的”模型和算法，所谓审计性未必有很明确的定义

对于计算机系统来说，信息安全中可审计性的定义为：

可审计性保证计算机信息系统所处理的信息的完整性、准确性和可靠性，防止有意或无意地出现错误，乃至防止和发现计算机犯罪案件。

对于“新兴的”模型、算法的可审计性，又看到一种新的解释：

区块链的技术应用的可审计性不足。这里所说的审计不是我们通常意义上讲的所谓财务会计的审计，关于区块链的可审计性主要说的是两层意思。第一层意思说的是相关的创新是应用了区块链的所有的特性还是仅仅利用了区块链的部分的技术，甚至并没有任何实质性的区块链的技术内容而仅仅是打着区块链的旗号等等。
第二层意思是，当一些区块链掌握在特定的组织或者部分人手中的时候，其实某些公有链已经显示出这个特点了，不要说私有和联盟链了，在这个情况下所谓技术的中立性、所谓数据的不可篡改性等等，基本的特性是不是得到了充分的保障？这一点需不需要经由认定，由谁来认定，有没有可能认定等等，这些问题我觉得也还没有解决，也就是说它可审计性不足。

yuanfan

我刚在网上搜到一篇讨论算法审计的文章，如何解决“算法通效率，但不够通人性”的弊端？北大国发院教授沈艳谈治理“大数据杀熟”和“算法黑箱”——推动算法审计是关键，部分摘录如下：

大数据杀熟等问题是平台提升服务过程中产生的副产品，在治理时不适合一刀切，更不应妖魔化。因此，短期来看，监管部门要推动平台建立更清晰的规则，加大治理人为的信息不对称，将治理结果公之于众，让公众理解这些问题有着相应的投诉和处理机制。而从长期来看，增加可解释性与透明度，推动算法审计是非常关键和重要的一步。

沈艳解释：“算法审计就是指搜集算法在特定环境中使用时表现的数据，然后评估算法是否对某些利益产生负面影响，从而判断算法本身的好坏，是否需要做出相应的调整。”

我认真想了想，算法审计确实只是借了审计这个词语，实际上要做的事应该是针对算法歧视的，偏向于道德伦理方面的审查。记得前几年坛友们在坛子里讨论过“信息茧房”的问题，但那时候大家好像都忽视了“算法歧视”的问题，可能也是因为日常生活中歧视实在太常见了。对于这些我只有一点很浅的思考，然后很快就卡住了……