【技术实现步骤摘要】
数据保护模型训练及数据保护方法、装置以及存储介质
[0001]本说明书实施例涉及计算机信息安全
,尤其涉及一种数据保护模型训练及数据保护方法、装置以及存储介质。
技术介绍
[0002]人工智能技术近年来发展迅速,并逐渐应用到各种日常场景中,例如自助支付场景、自动身份验证场景以及信息采集场景等,而通过各类端侧设备自动进行用户服务时,需要采集、传输、处理和存储用户的信息,用户信息中包含大量隐私数据信息,因此为了避免用户个人隐私信息泄露,需要对用户信息进行高效的管理和保护。
技术实现思路
[0003]本说明书实施例提供一种数据保护模型训练及数据保护方法、装置以及存储介质,可以解决相关技术中数据保护模型的性能较差的技术问题。
[0004]第一方面,本说明书实施例提供一种数据保护模型训练方法,该方法包括:
[0005]获取至少两个样本原始数据,将各样本原始数据输入至初始网络模型,得到各样本原始数据对应的样本输出数据,其中,所述初始网络模型基于预设保护函数构建;
[0006]获取所述预设保护 ...
【技术保护点】
【技术特征摘要】
1.一种数据保护模型训练方法,所述方法包括:获取至少两个样本原始数据,将各样本原始数据输入至初始网络模型,得到各样本原始数据对应的样本输出数据,其中,所述初始网络模型基于预设保护函数构建;获取所述预设保护函数对各样本原始数据处理后的各标准输出数据,基于各标准输出数据与各样本输出数据得到第一蒸馏损失;计算各标准输出数据之间的第一相关性以及各样本输出数据之间的第二相关性,基于所述第一相关性和所述第二相关性得到第二蒸馏损失;根据所述第一蒸馏损失和所述第二蒸馏损失构建第一损失函数,基于所述第一损失函数对所述初始网络模型进行第一训练,得到第一数据保护模型。2.根据权利要求1所述的方法,所述基于各标准输出数据与各样本输出数据得到第一蒸馏损失,包括:计算各标准输出数据与各标准输出数据对应的样本输出数据之间的第一子蒸馏损失,将各第一子蒸馏损失之和作为第一蒸馏损失。3.根据权利要求1所述的方法,所述计算各标准输出数据之间的第一相关性以及各样本输出数据之间的第二相关性,包括:基于同一预设规则对各标准输出数据以及各样本输出数据进行分组,得到至少一组标准输出数据组以及各标准输出数据组对应的样本输出数据组;分别计算每一组标准输出数据组中各标准输出数据之间的第一相关性,以及分别计算每一组样本输出数据组中各样本输出数据之间的第二相关性。4.根据权利要求3所述的方法,所述基于所述第一相关性和所述第二相关性得到第二蒸馏损失,包括:计算各第一相关性与各第一相关性对应的第二相关性之间的第二子蒸馏损失,将各第二子蒸馏损失之和作为第二蒸馏损失。5.根据权利要求1至3任一项所述的方法,所述得到第一数据保护模型之后,还包括:获取所述样本原始数据,将各样本原始数据输入至所述第一数据保护模型,以及基于所述第一损失函数得到第一损失结果;基于所述第一数据保护模型中的网络参数计算所述第一数据保护模型的稀疏损失;根据所述第一损失结果以及所述稀疏损失构建第二损失函数,基于所述第二损失函数对所述第一数据保护模型进行第二训练,得到第二数据保护模型。6.根据权利要求5所述的方法,所述根据所述第一损失结果以及所述稀疏损失构建第二损失函数,包括:获取所述第一损失结果的第一损失权重以及所述稀疏损失的第二损失权重;根据所述第一损失权重与所述第一损失结果的乘积以及所述第二损失权重与所述稀疏损失的乘积,构建第二损失函数。7.根据权利要求6所述的方法,所述获取所述第一损失函数的第一损失权重以及所述稀疏损失的第二损失权重,包括:根据上一次训练过程得到的第二损失结果以及预设权重网络模型,得到所述第一损失函数的第一损失...
【专利技术属性】
技术研发人员:曹佳炯,丁菁汀,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。