数据处理方法技术

技术编号:39513045 阅读:10 留言:0更新日期:2023-11-25 18:49
本申请公开了一种数据处理方法

【技术实现步骤摘要】
数据处理方法、装置、设备及存储介质


[0001]本申请属于数据处理
,尤其涉及一种数据处理方法

装置

设备及存储介质


技术介绍

[0002]联邦机器学习是一种分布式的机器学习方法,它允许多个参与方
(
如计算设备或节点
)
在保持数据隐私的前提下共同训练一个共享的全局模型

每个参与方只在本地训练模型,训练后的本地模型的数据会被发送到全局模型的所属方进行聚合,得到全局模型,然后全局模型的数据会被分发回各个参与方进行继续训练

[0003]然而,若参与方恶意泄露其训练的本地模型的数据,则目前全局模型的所属方无从证明被盗用的模型数据属于自己,也无从确定是哪个参与方泄露了数据,如此,会造成全局模型的所属方的损失


技术实现思路

[0004]本申请实施例提供一种数据处理方法

装置

设备及存储介质,能够解决相关技术中无法追溯联邦机器学习中涉及的部分模型数据,造成全局模型的所属方损失的问题

[0005]第一方面,本申请实施例提供一种数据处理方法,该方法可以包括:
[0006]接收
N
个参与方中每个参与方发送的第一神经网络模型,
N
为大于1的整数;
[0007]聚合每个参与方发送的第一神经网络模型,得到第二神经网络模型;
[0008]将身份信息嵌入第二神经网络模型,得到第三神经网络模型,身份信息包括参与方的第一身份信息和第二神经网络模型所属服务方的第二身份信息;
[0009]向每个参与方发送第三神经网络模型

[0010]第二方面,本申请实施例提供一种信息识别方法,该方法可以包括:
[0011]接收第三方计算平台发送的目标神经网络模型,目标神经网络模型包括第四神经网络模型;
[0012]从第四神经网络模型中抽取与预存层标识对应的第二隐藏层,预存层标识为嵌入身份信息的隐藏层的标识;
[0013]从第二隐藏层的第三特征参数中提取目标身份信息;
[0014]在目标身份信息与预存身份信息匹配的情况下,显示提示信息,预存身份信息包括参与训练第四神经网络模型的目标参与方的身份信息和四神经网络模型所属服务方的身份信息,提示信息用于提示第三方计算平台盗用服务方的神经网络模型

且第四神经网络模型由目标参与方训练

[0015]第三方面,本申请实施例提供一种数据处理装置,包括:
[0016]接收模块,用于接收
N
个参与方中每个参与方发送的第一神经网络模型,
N
为大于1的整数;
[0017]聚合模块,用于聚合每个参与方发送的第一神经网络模型,得到第二神经网络模
型;
[0018]嵌入模块,用于将身份信息嵌入第二神经网络模型,得到第三神经网络模型,身份信息包括参与方的第一身份信息和第二神经网络模型所属服务方的第二身份信息;
[0019]发送模型,用于向每个参与方发送第三神经网络模型

[0020]第四方面,本申请实施例提供一种信息识别装置,包括:
[0021]接收模块,用于接收第三方计算平台发送的目标神经网络模型,目标神经网络模型包括第四神经网络模型;
[0022]抽取模块,用于从第四神经网络模型中抽取与预存层标识对应的第二隐藏层,预存层标识为嵌入身份信息的隐藏层的标识;
[0023]提取模块,用于从第二隐藏层的第三特征参数中提取目标身份信息;
[0024]显示模块,用于在目标身份信息与预存身份信息匹配的情况下,显示提示信息,预存身份信息包括参与训练第四神经网络模型的目标参与方的身份信息和四神经网络模型所属服务方的身份信息,提示信息用于提示第三方计算平台盗用服务方的神经网络模型

且第四神经网络模型由目标参与方训练

[0025]第五方面,本申请实施例提供了一种计算机设备,该计算机设备包括:处理器以及存储有计算机程序指令的存储器;
[0026]处理器执行计算机程序指令时实现如第一方面所示的数据处理方法

或第二方面所示的信息识别方法

[0027]第六方面,本申请实施例提供了一种计算机存储介质,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如第一方面所示的数据处理方法

或第二方面所示的信息识别方法

[0028]第七方面,本申请实施例提供了一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现如第一方面所示的数据处理方法

或第二方面所示的信息识别方法

[0029]第八方面,本申请实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如第一方面所示的数据处理方法

或第二方面所示的信息识别方法

[0030]本申请实施例的数据处理方法

装置

设备及存储介质,可以接收
N
个参与方中每个参与方发送的第一神经网络模型,并聚合每个参与方发送的第一神经网络模型,得到第二神经网络模型,然后,将身份信息嵌入第二神经网络模型,得到第三神经网络模型,身份信息包括参与方的第一身份信息和第二神经网络模型所属服务方的第二身份信息,并向每个参与方发送第三神经网络模型

这样,通过在每个参与方聚合后的第二神经网络模型中嵌入参与方的第一身份信息和所述第二神经网络模型所属服务方的第二身份信息,并将嵌入身份信息的第三神经网络模型发送至每个参与方,以进行下一次的模型训练,如此,在参与方泄露其训练的本地模型的数据时,可以通过身份信息准确锁定泄露的模型数据为服务方的神经网络模型和其泄露该模型数据的参与方,避免了服务方的损失

附图说明
[0031]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使
用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图

[0032]图1为本申请实施例提供的一种数据处理方法的架构图;
[0033]图2为本申请实施例提供的一种数据处理方法的流程图;
[0034]图3为本申请实施例提供的一种数据处理方法的训练原理示意图;
[0035]图4为本申请实施例提供的一种数据处理方法的验证过程示意图;
[0036]图5为本申请实施例提供的一种信息识别方法的流程图;
[0037]图6是本申请一个实施例提供的数据处理装置的结构示意图;
[0038]图7是本申请一个实施例提供的信息识别装置的结本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种数据处理方法,包括:接收
N
个参与方中每个参与方发送的第一神经网络模型,
N
为大于1的整数;聚合所述每个参与方发送的第一神经网络模型,得到第二神经网络模型;将身份信息嵌入所述第二神经网络模型,得到所述第三神经网络模型,所述身份信息包括参与方的第一身份信息和所述第二神经网络模型所属服务方的第二身份信息;向所述每个参与方发送所述第三神经网络模型
。2.
根据权利要求1所述的方法,其特征在于,所述第二神经网络模型包括
M
层隐藏层,
M
为正整数;所述将身份信息嵌入所述第二神经网络模型,得到所述第三神经网络模型,包括:从所述
M
层隐藏层中抽取第一隐藏层;基于所述第一隐藏层中的权重参数,生成所述第一隐藏层的第一特征参数;基于所述身份信息和所述第一特征参数,生成所述第二特征参数;将所述第一特征参数替换为所述第二特征参数,得到所述第三神经网络模型
。3.
根据权利要求2所述的方法,其特征在于,所述基于所述身份信息和所述第一特征参数,生成所述第二特征参数,包括:通过预设密钥矩阵,对所述第一特征参数进行投影,得到所述第一特征参数的仿制参数;通过所述身份信息的第一表示参数,对所述仿制参数进行迭代训练,直至所述第一表示参数和所述仿制参数的目标距离值小于或等于预设距离值的情况下,将与所述目标距离值对应的仿制参数确定为所述第二特征参数
。4.
根据权利要求3所述的方法,其特征在于,所述仿制参数和所述第一表示参数的矩阵长度相同且为所述矩阵长度的值为目标长度值,所述第一表示参数包括第
j
个元素;所述通过所述身份信息的第一表示参数,对所述仿制参数进行迭代训练,包括:从所述第一表示参数中提取第
j
个参数,
j∈[1,L]

L
为所述目标长度值;按照所述矩阵长度,通过所述第
j
个元素和所述第
j
个参数,计算所述第
j
个参数和所述仿制参数的距离值
。5.
根据权利要求3或4所述的方法,其特征在于,所述方法还包括:对所述第一身份信息和所述第二身份信息进行编码,得到所述身份信息的第一表示参数
。6.
根据权利要求5所述的方法,其特征在于,所述基于所述第一隐藏层中的权重参数,生成所述第一隐藏层的第一特征参数,包括:基于所述权重参数和所述第二神经网络模型中卷积核的输出通道的数量,计算沿着输出通道计算模型权重的均值;将所述均值确定为所述第一特征参数
。7.
根据权利要求1所述的方法,其特征在于,所述方法还包括:在获取第三方计算平台的第四神经网络模型的情况下,获取预先存储的第一隐藏层的层标识;从所述第四神经网络模型中抽取与所述层标识对应的第二隐藏层;从所述第二隐藏层的第三特征参数中提取目标身份信息;
在所述目标身份信息与所述身份信息匹配的情况下,显示提示信息,所述提示信息用于提示所述第三方计算平台盗用所述服务方的神经网络模型

且所述第四神经网络模型由目标参数方训练
。8.
根据权利要求7所述的方法,其特征在于,所述从所述第二隐藏层的第三特征参数中提取目标身份信息,包括:从所述目标身份信息的第二标识参数中提取第

【专利技术属性】
技术研发人员:艾博轩郑建宾高鹏飞杨燕明
申请(专利权)人:中国银联股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1