【技术实现步骤摘要】
机器学习模型的风险评估方法、装置、设备及存储介质
本申请涉及计算机技术,尤其涉及人工智能
,具体涉及一种机器学习模型的风险评估方法、装置、设备及存储介质。
技术介绍
机器学习技术正在得到越来越多的应用。基于大规模数据并经过一定时间和计算成本训练得到的机器学习模型是机器学习技术得到真正应用的关键。比如,机器学习即服务(MachineLearningasaService;MLaaS)的模式使得机器学习模型能够给诸如金融、医疗、销售等诸多领域方便地提供各种服务。然而,机器学习模型在提供服务的同时,也面临着各种各样的威胁和攻击,存在着隐私泄露的风险。一旦发生隐私泄露,势必给企业和个人带来危害。因此,作为机器学习模型提供和改进服务时的重要参考,评估机器学习模型的隐私泄露风险是亟需的重要需求。现有技术中并没有针对机器学习模型隐私泄露进行系统化地评估,多是从攻击和测试的角度对机器学习模型进行漏洞或风险利用,以此证明机器学习模型存在着隐私泄露风险。因此,亟需提供一种机器学习模型的风险评估方案,以评估机器学习模型的隐私泄露风险。
技术实现思路
为了弥补现有技术的不足,本申请提供了一种机器学习模型的风险评估方法、装置、电子设备及存储介质。根据本申请的一方面,提供了一种机器学习模型的风险评估方法,其中,所述方法包括如下步骤:获取机器学习模型的自身信息泄露的风险值;获取所述机器学习模型泄露训练数据的风险值;基于所述机器学习模型的自身信息泄露的风险值和所述机器学习模型泄露训练数 ...
【技术保护点】
1.一种机器学习模型的风险评估方法,其中,所述方法包括如下步骤:/n获取机器学习模型的自身信息泄露的风险值;/n获取所述机器学习模型泄露训练数据的风险值;/n基于所述机器学习模型的自身信息泄露的风险值和所述机器学习模型泄露训练数据的风险值,评估所述机器学习模型的风险值。/n
【技术特征摘要】
1.一种机器学习模型的风险评估方法,其中,所述方法包括如下步骤:
获取机器学习模型的自身信息泄露的风险值;
获取所述机器学习模型泄露训练数据的风险值;
基于所述机器学习模型的自身信息泄露的风险值和所述机器学习模型泄露训练数据的风险值,评估所述机器学习模型的风险值。
2.根据权利要求1所述的方法,其中,获取机器学习模型的自身信息泄露的风险值,包括:
获取所述机器学习模型的综合成本;
获取所述机器学习模型的提取攻击风险值;
基于所述机器学习模型的综合成本和所述机器学习模型的提取攻击风险值,配置所述机器学习模型的自身信息泄露的风险值。
3.根据权利要求2所述的方法,其中,获取所述机器学习模型的综合成本,包括:
获取预先为所述机器学习模型配置的算法成本、结构成本、参数成本、训练时间成本、空间成本以及其他成本中的至少一个;
基于所述机器学习模型的算法成本、结构成本、参数成本、训练时间成本、空间成本以及其他成本中的至少一个,配置所述机器学习模型的综合成本。
4.根据权利要求2所述的方法,其中,获取所述机器学习模型的提取攻击风险值,包括:
获取所述机器学习模型在多次提取攻击测试中提取攻击的准确度;
获取所述机器学习模型在多次提取攻击测试中提取攻击的保真度;
基于所述机器学习模型在多次提取攻击测试中,各次提取攻击测试下提取攻击的准确度和保真度,配置所述机器学习模型的提取攻击风险值。
5.根据权利要求1所述的方法,其中,获取所述机器学习模型泄露训练数据的风险值,包括:
获取所述机器学习模型的敏感度信息;
获取所述机器学习模型面对成员关系推理攻击的风险值;
获取所述机器学习模型面对属性推理攻击的风险值;
基于所述机器学习模型的敏感度信息、所述机器学习模型面对成员关系推理攻击的风险值以及所述机器学习模型面对属性推理攻击的风险值,配置所述机器学习模型泄露训练数据的风险值。
6.根据权利要求5所述的方法,其中,获取所述机器学习模型的敏感度信息,包括:
获取所述机器学习模型的训练数据的个人属性敏感度;
获取所述机器学习模型的训练数据的社会属性敏感度;
获取所述机器学习模型的训练数据的自然属性敏感度;
基于所述个人属性敏感度、所述社会属性敏感度和所述自然属性敏感度,配置所述机器学习模型的敏感度信息。
7.根据权利要求5所述的方法,其中,获取所述机器学习模型面对成员关系推理攻击的风险值,包括:
获取所述机器学习模型在多次成员关系推理攻击测试中的攻击到训练数据的真正例;
获取所述机器学习模型在多次成员关系推理攻击测试中的攻击到非训练数据的假正例;
基于所述机器学习模型在多次成员关系推理攻击测试中,攻击到训练数据的真正例和攻击到非训练数据的假正例,配置所述机器学习模型面对成员关系推理攻击的风险值。
8.根据权利要求5所述的方法,其中,获取所述机器学习模型面对属性推理攻击的风险值,包括:
获取所述机器学习模型在各次属性推理攻击中攻击到训练数据的数个敏感属性的召回率;
获取所述机器学习模型在各次属性推理攻击中攻击到训练数据的数个敏感属性的假正例;
基于所述机器学习模型在多次属性推理攻击测试中,攻击到训练数据的数个敏感属性的召回率和攻击到训练数据的数个敏感属性的假正例,配置所述机器学习模型面对属性推理攻击的风险值。
9.一种机器学习模型的风险评估装置,其中,所述装置包括:
第一获取模块,用于获取机器学习模型的自身信息泄露的风险值;
第二获取模块,用于获取所述机器学习模型泄露训练数据的风险值;
评估模块,用于基于所述机器学习模型的自身信息泄露的风险...
【专利技术属性】
技术研发人员:徐坤,洪爵,蒋精华,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。