【技术实现步骤摘要】
数据处理方法、装置、设备及存储介质
[0001]本申请属于数据处理
,尤其涉及一种数据处理方法
、
装置
、
设备及存储介质
。
技术介绍
[0002]联邦机器学习是一种分布式的机器学习方法,它允许多个参与方
(
如计算设备或节点
)
在保持数据隐私的前提下共同训练一个共享的全局模型
。
每个参与方只在本地训练模型,训练后的本地模型的数据会被发送到全局模型的所属方进行聚合,得到全局模型,然后全局模型的数据会被分发回各个参与方进行继续训练
。
[0003]然而,若参与方恶意泄露其训练的本地模型的数据,则目前全局模型的所属方无从证明被盗用的模型数据属于自己,也无从确定是哪个参与方泄露了数据,如此,会造成全局模型的所属方的损失
。
技术实现思路
[0004]本申请实施例提供一种数据处理方法
、
装置
、
设备及存储介质,能够解决相关技术中无法追溯联邦机器学习中涉及的部分模型数据,造成全局模型的所属方损失的问题
。
[0005]第一方面,本申请实施例提供一种数据处理方法,该方法可以包括:
[0006]接收
N
个参与方中每个参与方发送的第一神经网络模型,
N
为大于1的整数;
[0007]聚合每个参与方发送的第一神经网络模型,得到第二神经网络模型;
[0008]将身份信息嵌入第二神经网络模型 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.
一种数据处理方法,包括:接收
N
个参与方中每个参与方发送的第一神经网络模型,
N
为大于1的整数;聚合所述每个参与方发送的第一神经网络模型,得到第二神经网络模型;将身份信息嵌入所述第二神经网络模型,得到所述第三神经网络模型,所述身份信息包括参与方的第一身份信息和所述第二神经网络模型所属服务方的第二身份信息;向所述每个参与方发送所述第三神经网络模型
。2.
根据权利要求1所述的方法,其特征在于,所述第二神经网络模型包括
M
层隐藏层,
M
为正整数;所述将身份信息嵌入所述第二神经网络模型,得到所述第三神经网络模型,包括:从所述
M
层隐藏层中抽取第一隐藏层;基于所述第一隐藏层中的权重参数,生成所述第一隐藏层的第一特征参数;基于所述身份信息和所述第一特征参数,生成所述第二特征参数;将所述第一特征参数替换为所述第二特征参数,得到所述第三神经网络模型
。3.
根据权利要求2所述的方法,其特征在于,所述基于所述身份信息和所述第一特征参数,生成所述第二特征参数,包括:通过预设密钥矩阵,对所述第一特征参数进行投影,得到所述第一特征参数的仿制参数;通过所述身份信息的第一表示参数,对所述仿制参数进行迭代训练,直至所述第一表示参数和所述仿制参数的目标距离值小于或等于预设距离值的情况下,将与所述目标距离值对应的仿制参数确定为所述第二特征参数
。4.
根据权利要求3所述的方法,其特征在于,所述仿制参数和所述第一表示参数的矩阵长度相同且为所述矩阵长度的值为目标长度值,所述第一表示参数包括第
j
个元素;所述通过所述身份信息的第一表示参数,对所述仿制参数进行迭代训练,包括:从所述第一表示参数中提取第
j
个参数,
j∈[1,L]
,
L
为所述目标长度值;按照所述矩阵长度,通过所述第
j
个元素和所述第
j
个参数,计算所述第
j
个参数和所述仿制参数的距离值
。5.
根据权利要求3或4所述的方法,其特征在于,所述方法还包括:对所述第一身份信息和所述第二身份信息进行编码,得到所述身份信息的第一表示参数
。6.
根据权利要求5所述的方法,其特征在于,所述基于所述第一隐藏层中的权重参数,生成所述第一隐藏层的第一特征参数,包括:基于所述权重参数和所述第二神经网络模型中卷积核的输出通道的数量,计算沿着输出通道计算模型权重的均值;将所述均值确定为所述第一特征参数
。7.
根据权利要求1所述的方法,其特征在于,所述方法还包括:在获取第三方计算平台的第四神经网络模型的情况下,获取预先存储的第一隐藏层的层标识;从所述第四神经网络模型中抽取与所述层标识对应的第二隐藏层;从所述第二隐藏层的第三特征参数中提取目标身份信息;
在所述目标身份信息与所述身份信息匹配的情况下,显示提示信息,所述提示信息用于提示所述第三方计算平台盗用所述服务方的神经网络模型
、
且所述第四神经网络模型由目标参数方训练
。8.
根据权利要求7所述的方法,其特征在于,所述从所述第二隐藏层的第三特征参数中提取目标身份信息,包括:从所述目标身份信息的第二标识参数中提取第
技术研发人员:艾博轩,郑建宾,高鹏飞,杨燕明,
申请(专利权)人:中国银联股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。