【技术实现步骤摘要】
保护神经网络模型安全的方法及装置
本说明书实施例涉及数据安全
,尤其涉及一种保护神经网络模型安全的方法及装置。
技术介绍
目前,利用大量数据训练神经网络,使得神经网络具有良好的预测效果,是业界的经典做法。神经网络会记住数据的特点,从而在预测时给出准确的预测结果。但是,当训练数据是用户个人信息等敏感或隐私数据时,训练出的神经网络携带大量敏感、隐私信息,如果直接将模型全部曝光,很容易被攻击者或者灰产通过模型攻击,窃取模型中携带的敏感信息。因此,需要一种方案,可以在保证模型预测性能的同时,实现对神经网络模型安全的保护,以防止敏感隐私信息的泄露。
技术实现思路
在本说明书描述的保护神经网络模型安全的方法及装置中,通过对训练好的模型中每一层携带的敏感信息进行测算,然后对携带较多敏感信息的网络层进行安全处理,可以提升预测效率、保证预测性能,并实现隐私保护。根据第一方面,提供一种保护神经网络模型安全的方法,包括:获取神经网络模型,其中包括利用训练数据训练得到的多个网络层;针对所述多个网络层中任意的第一网络层,在固定其他网络层参数的情况下,利用所述训练数据对所述第一网络层进行第一调参,得到与所述神经网络模型对应的第一微调模型;确定所述第一微调模型对应预设性能指标的第一指标值,所述预设性能指标的指标值取决于对应模型,在测试数据上的测试损失和在所述训练数据上的训练损失之间的相对大小;在固定所述其他网络层参数的情况下,利用所述训练数据和测试数据对所述第一网络层进行第二调参,得到与所述神经网络模型对 ...
【技术保护点】
1.一种保护神经网络模型安全的方法,包括:/n获取神经网络模型,其中包括利用训练数据训练得到的多个网络层;/n针对所述多个网络层中任意的第一网络层,在固定其他网络层参数的情况下,利用所述训练数据对所述第一网络层进行第一调参,得到与所述神经网络模型对应的第一微调模型;/n确定所述第一微调模型对应预设性能指标的第一指标值,所述预设性能指标的指标值取决于对应模型,在测试数据上的测试损失和在所述训练数据上的训练损失之间的相对大小;/n在固定所述其他网络层参数的情况下,利用所述训练数据和测试数据对所述第一网络层进行第二调参,得到与所述神经网络模型对应的第二微调模型;/n确定所述第二微调模型对应所述预设性能指标的第二指标值;/n基于所述第一指标值和所述第二指标值的相对大小,确定所述第一网络层对应的信息敏感度;/n在所述信息敏感度大于预定阈值的情况下,对所述第一网络层进行安全处理。/n
【技术特征摘要】
1.一种保护神经网络模型安全的方法,包括:
获取神经网络模型,其中包括利用训练数据训练得到的多个网络层;
针对所述多个网络层中任意的第一网络层,在固定其他网络层参数的情况下,利用所述训练数据对所述第一网络层进行第一调参,得到与所述神经网络模型对应的第一微调模型;
确定所述第一微调模型对应预设性能指标的第一指标值,所述预设性能指标的指标值取决于对应模型,在测试数据上的测试损失和在所述训练数据上的训练损失之间的相对大小;
在固定所述其他网络层参数的情况下,利用所述训练数据和测试数据对所述第一网络层进行第二调参,得到与所述神经网络模型对应的第二微调模型;
确定所述第二微调模型对应所述预设性能指标的第二指标值;
基于所述第一指标值和所述第二指标值的相对大小,确定所述第一网络层对应的信息敏感度;
在所述信息敏感度大于预定阈值的情况下,对所述第一网络层进行安全处理。
2.根据权利要求1所述的方法,其中,确定所述第一微调模型对应预设性能指标的第一指标值,包括:
确定所述第一微调模型在所述测试数据上的第一测试损失;
确定所述第一微调模型在所述训练数据上的第一训练损失;
基于所述第一测试损失和第一训练损失的差值,确定所述第一指标值。
3.根据权利要求1所述的方法,其中,确定所述第一网络层对应的信息敏感度,包括:
确定所述第一指标值和第二指标值的差值;
将所述差值与所述第一指标值之间比值的绝对值,确定为所述信息敏感度;或,将所述差值与所述第二指标值之间比值的绝对值,确定为所述信息敏感度。
4.根据权利要求1所述的方法,其中,对所述第一网络层进行安全处理,包括:
将所述第一网络层部署到可信执行环境TEE。
5.根据权利要求4所述的方法,其中,在将所述第一网络层部署到可信执行环境TEE之后,所述方法还包括:
响应于对所述神经网络模型的使用请求,获取待预测的目标样本;
通过在所述第一网络层针对所述目标样本输出的原始数据中,添加用于实现差分隐私的噪声,得到所述第一网络层的最终输出数据,用于确定所述目标样本的预测结果。
6.根据权利要求1所述的方法,其中,对所述第一网络层进行安全处理,包括:
在所述第一网络层的网络参数中添加用于实现差分隐私的噪声,得到最终使用的网络参数。
7.根据权利要求1所述的方法,其中,对所述第一网络层进行安全处理,包括:
将经过所述第二调参的第二网络层部署到可信执行环境TEE。
8.一种保护神经网络模型安全的装置,包括:
模型获取单元,配置为获取神经网络模型,其中包括利用训练数据训练得到的多个网络层;
第一调参单元,配置为针对所述多个网络层中任意的第一...
【专利技术属性】
技术研发人员:王力,周俊,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。