【技术实现步骤摘要】
基于纵向联邦学习的数据预测方法、装置和计算机设备
[0001]本申请涉及联邦学习
,特别是涉及一种基于纵向联邦学习的数据预测方法、装置和计算机设备。
技术介绍
[0002]随着人工智能技术的发展,人们为解决数据孤岛的问题,提出了“联邦学习”的概念,联邦学习中的发起方和参与方作为成员方,在不用给出己方数据的情况下,也可进行模型训练得到模型参数,并且可以避免数据隐私泄露的问题。由于联邦学习过程需要大量的数据来支持,而数据又大都分布于不同的数据持有方,所以需要联合各个数据持有方来进行模型构建。其中,纵向联邦学习是在参与者的数据特征重叠较小,而用户重叠较多的情况下,取出参与者用户相同而用户数据特征不同的那部分用户及数据进行联合训练机器学习模型。
[0003]然而,在纵向联邦学习过程中,通常基于同态加密、混淆电路(Garbled Circuits,简称为CG)算法或者秘密分享(Secret
‑
Sharing,简称为SS)算法的方式进行数据计算,上述算法由于需要第三方支持,所以参与纵向联邦学习的各成员方的本地数据的安全性无法保证。
[0004]针对相关技术中纵向联邦学习依赖于第三方实现导致成员方本地数据的安全性较低的问题,目前还没有提出有效的解决方案。
技术实现思路
[0005]基于此,有必要针对上述技术问题,提供一种能够提高成员方本地数据的安全性的基于纵向联邦学习的数据预测方法、装置、计算机设备和计算机可读存储介质。
[0006]在本实施例中提供了一种基于纵向联邦 ...
【技术保护点】
【技术特征摘要】
1.一种基于纵向联邦学习的数据预测方法,其特征在于,所述方法包括:根据总模型在上一时间步的全局损失对各成员方本地模型的第一模型参数的参数值进行更新,其中,所述本地模型为循环时间网络模型,所述第一模型参数的类型根据所述循环时间网络模型的输出结果确定;将时序性的标签数据输入所述成员方的本地模型,根据更新后的第一模型参数确定所述本地模型在当前时间步的输出结果,对所述输出结果进行加密,并将加密后的所述输出结果上传至区块链;通过所述区块链的智能合约在多个成员方中确定在当前时间步进行上层模型训练的执行方,将所有本地模型在当前时间步的加密后的输出结果传递至每个所述执行方,其中,所述上层模型和所述本地模型构成所述总模型;根据所述总模型在上一时间步的全局损失对所述上层模型的第二模型参数的参数值进行更新,其中,所述第二模型参数的类型根据所述上层模型的类型和输出结果确定;对于每个所述执行方,将所有本地模型在当前时间步的加密后的输出结果作为所述上层模型的输入,对所述上层模型进行当前时间步的训练,根据更新后的所述第二模型参数值得到所述标签数据的当前预测值。2.根据权利要求1所述的方法,其特征在于,所述将所有本地模型在当前时间步的加密后的输出结果作为所述上层模型的输入包括:在所述上层模型为线性模型的情况下,在加密后的输出结果中确定多个隐藏状态,将多个所述隐藏状态进行拼接得到所述上层模型的输入。3.根据权利要求1所述的方法,其特征在于,所述将所有本地模型在当前时间步的加密后的输出结果作为所述上层模型的输入包括:在所述上层模型为循环时间网络模型的情况下,在加密后的输出结果中确定多个与所述标签数据对应的初始预测值,将多个所述初始预测值进行拼接得到拼接结果;将所述拼接结果和所述总模型在上一时间步的隐藏状态作为所述上层模型的输入。4.根据权利要求1所述的方法,其特征在于,所述将所有本地模型在当前时间步的加密后的输出结果作为所述上层模型的输入包括:在所述上层模型为循环时间网络模型的情况下,在加密后的输出结果中确定多个隐藏状态,将多个所述隐藏状态进行拼接得到拼接结果;将所述拼接结果和所述总模型在上一时间步的隐藏状态作为所述上层模型的输入。5.根据权利要求3或4所述的方法,其特征在于,所述根据所述总模型在上一时间步的全局损失对所述上层模型的第二模型参数进行更新包括:根据所述上层模型更新后的权重参数、所述上层模型的输入、所述总模型在上一时间步的隐藏状态以及激活函数,确定所述执行方的上层模型的当前重置门和当前更新门,其中,所述上层模型的权重参数根据所述总模型在上一时间步的全局损失进行更新;根据所述上层模型更新后的权重参数、所述当前重置门、所述当前更新门、所述上层模型的输入以及总模型在上一时间步的隐藏状态确定所述上层模型的当前隐藏状态。6.根据权利要求1所述的方法,其特征在于,所述将所有本地模型在当前时间步的加密后的输出结果作为所述上层模型的输入包括:在所述上层模型包括循环时间网络模型和分类模型的情况下,在加密后的输出结果中
确定多个隐藏状态,将...
【专利技术属性】
技术研发人员:汪小益,蔡亮,严杨,李伟,邱炜伟,
申请(专利权)人:杭州趣链科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。