一种具有奖惩机制的联邦学习方法及相关装置制造方法及图纸

技术编号:33130080 阅读:45 留言:0更新日期:2022-04-17 00:45
本申请公开了一种具有奖惩机制的联邦学习方法及相关装置,该方法由从链中的上传节点执行,上传节点为从链中用于上传第一本地参数至主链中主链节点的从链节点,该方法包括:上传节点获取待上传的第一本地参数和待验证的第一本地参数,待上传的第一本地参数为通过共识验证的第一本地参数,待验证的第一本地参数为未经过共识验证的第一本地参数;比较待上传的第一本地参数和待验证的第一本地参数,获得比较结果,比较结果包括第一本地参数被篡改或第一本地参数未被篡改;基于比较结果根据预设处理策略对第一训练节点执行奖励或扣除数字代币,第一训练节点为训练得到第一本地参数的节点,该方案提高了各个从链节点参与联邦学习的积极性。的积极性。的积极性。

【技术实现步骤摘要】
一种具有奖惩机制的联邦学习方法及相关装置


[0001]本申请涉及联邦学习
,特别是涉及一种具有奖惩机制的联邦学习方法及相关装置。

技术介绍

[0002]为了实现快速学习获得机器学习模型,Google人工智能实验室提出了联邦学习架构,具体是用于实现使得多个分散的客户端和一个中心服务器能够协作学习一个机器学习模型,用于提高学习模型的效率。但是,在现有的联邦学习架构中,参与机器学习模型训练的边缘终端设备提供的数据是否真实、数据样本是否足够大,对模型训练准确性至关重要。但是在现有的联邦学习架构中,都无法保证数据真实性和数据样本的足够强大,也无法提高参与联邦学习的边缘终端的积极性,故急需一种可以解决上述技术问题的技术方案。

技术实现思路

[0003]本申请主要解决的技术问题是提供一种具有奖惩机制的联邦学习方法及相关装置,可以提高各个从链节点参与联邦学习的积极性。
[0004]为解决上述技术问题,本申请采用的一个技术方案是:提供一种具有奖惩机制的联邦学习方法,所述方法是由从链中的上传节点执行,所述上传节点为所述从链中用于上传第一本地参数至主链中的主链节点的从链节点,所述从链中的从链节点包括若干训练节点和若干共识节点,所述方法包括:
[0005]所述上传节点获取待上传的第一本地参数和待验证的第一本地参数,其中,所述待上传的第一本地参数为通过所述若干共识节点共识验证的第一本地参数,所述待验证的第一本地参数为未经过所述共识验证的第一本地参数;
[0006]比较所述待上传的第一本地参数和所述待验证的第一本地参数,获得比较结果,所述比较结果包括所述第一本地参数被篡改或所述第一本地参数未被篡改;
[0007]基于所述比较结果,根据预设处理策略对所述第一训练节点执行奖励数字代币或扣除数字代币,其中,所述第一训练节点为训练得到所述第一本地参数的所述训练节点。
[0008]为解决上述技术问题,本申请采用的另一个技术方案是:提供一种具有奖惩机制的联邦学习方法,所述方法是由主链中的主链节点执行,所述主链中包括若干所述主链节点,每个所述主链节点能够与从链中的上传节点进行交互,所述方法包括:
[0009]主链节点获取第一预设数量的从链节点训练得到的目标本地参数;
[0010]对所述第一预设数量的目标本地参数进行聚合,得到第一全局参数;
[0011]分别确定每个所述目标本地参数对所述第一全局参数的贡献值;
[0012]基于每个所述目标本地参数中对所述第一全局参数的贡献值,分别对各个所述目标本地参数对应的关联从链节点执行预设奖惩处理;其中,预设奖惩处理中对数字代币的处理数量,与所述目标本地参数对所述第一全局参数的贡献值正相关;所述目标本地参数对应的关联从链节点包括训练得到所述目标本地参数的训练节点和/或对所述目标本地参
数进行共识验证的共识节点。
[0013]为解决上述技术问题,本申请采用的又一个技术方案是:提供一种具有奖惩机制的联邦学习系统,所述系统包括能够进行交互的主链和从链,其中,所述从链中设置有上传节点,所述上传节点为所述从链中用于上传第一本地参数至主链的从链节点,所述从链中的从链节点包括了若干训练节点和若干共识节点;
[0014]所述训练节点用于训练获得第一本地参数,所述共识节点用于对所述训练节点训练所得的所述第一本地参数进行共识验证,并将通过所述共识验证的第一本地参数确定为待上传的第一本地参数;
[0015]所述上传节点用于获取待上传的第一本地参数和待验证的第一本地参数;并用于比较所述待上传的第一本地参数和所述待验证的第一本地参数,获得比较结果;并基于所述比较结果,根据预设处理策略对所述第一训练节点执行奖励数字代币或扣除数字代币,其中,所述待上传的第一本地参数为经过所述若干共识节点共识验证的第一本地参数,所述待验证的第一本地参数为未经过所述共识验证的第一本地参数;所述比较结果包括所述第一本地参数被篡改或所述第一本地参数未被篡改;所述第一训练节点为训练得到所述第一本地参数的所述训练节点。
[0016]为解决上述技术问题,本申请采用的又一个技术方案是:提供一种具有奖惩机制的联邦学习系统,所述系统包括能够进行交互的主链和从链,其中,所述从链中包括若干从链节点,所述主链包括若干主链节点,每个所述主链节点能够与至少一个所述从链节点进行交互;
[0017]所述主链节点用于获取第一预设数量的从链节点训练得到的目标本地参数,并对所述第一预设数量的目标本地参数进行聚合,得到第一全局参数;
[0018]所述主链节点还用于分别确定每个所述目标本地参数对所述第一全局参数的贡献值;并基于每个所述目标本地参数中对所述第一全局参数的贡献值,分别对各个所述目标本地参数对应的关联从链节点执行预设奖惩处理;其中,预设奖惩处理中对数字代币的处理数量,与所述目标本地参数对所述第一全局参数的贡献值正相关;所述目标本地参数对应的关联从链节点包括训练得到所述目标本地参数的训练节点和/或对所述目标本地参数进行共识验证的共识节点。
[0019]为解决上述技术问题,本申请采用的又一个技术方案是:提供一种电子设备,所述电子设备包括处理器以及与所述处理器耦接的存储器;其中,
[0020]所述存储器用于存储计算机程序;
[0021]所述处理器用于运行所述计算机程序以执行如上任意一项所述的方法。
[0022]为解决上述技术问题,本申请采用的又一个技术方案是:提供一种计算机可读存储介质,所述计算机可读存储介质存储有能够被处理器运行的计算机程序,所述计算机程序用于实现如上任一项所述的方法。
[0023]本申请的有益效果是:区别于现有技术的情况,本申请所提供的技术方案,通过设置由联邦学习系统的从链中的上传节点执行,且上传节点通过获取待上传的第一本地参数和待验证的第一本地参数,并比较待上传的第一本地参数和待验证的第一本地参数,获得比较结果,且比较结果包括第一本地参数被篡改或第一本地参数未被篡改;然后基于比较结果,根据预设处理策略对第一训练节点执行奖励数字代币或扣除数字代币,在本申请所
提供的上述技术方案中,通过在基于区块链的联邦学习方案中设置奖惩机制,可以较好地提高各个从链节点参与联邦学习的积极性,起到了良好的技术效果。
附图说明
[0024]图1为本申请一种具有奖惩机制的联邦学习系统一实施例中的结构示意图;
[0025]图2为本申请一种具有奖惩机制的联邦学习方法一实施例中的流程示意图;
[0026]图3为本申请一种具有奖惩机制的联邦学习的方法另一实施例中的流程示意图;
[0027]图4为本申请一种具有奖惩机制的联邦学习的方法另一实施例中的流程示意图;
[0028]图5为本申请一种具有奖惩机制的联邦学习的方法一实施例中的流程示意图;
[0029]图6为本申请一种具有奖惩机制的联邦学习的方法另一实施例中的流程示意图;
[0030]图7为本申请一种具有奖惩机制的联邦学习的方法又一实施例中的流本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种具有奖惩机制的联邦学习方法,其特征在于,所述方法是由从链中的上传节点执行,所述上传节点为所述从链中用于上传第一本地参数至主链中的主链节点的从链节点,所述从链中的从链节点包括若干训练节点和若干共识节点,所述方法包括:所述上传节点获取待上传的第一本地参数和待验证的第一本地参数,其中,所述待上传的第一本地参数为通过所述若干共识节点共识验证的第一本地参数,所述待验证的第一本地参数为未经过所述共识验证的第一本地参数;比较所述待上传的第一本地参数和所述待验证的第一本地参数,获得比较结果,所述比较结果包括所述第一本地参数被篡改或所述第一本地参数未被篡改;基于所述比较结果,根据预设处理策略对第一训练节点执行奖励数字代币或扣除数字代币,其中,所述第一训练节点为训练得到所述第一本地参数的所述训练节点。2.根据权利要求1所述的方法,其特征在于,所述获得比较结果之后,所述方法还包括:将所述第一本地参数对应的比较结果广播至所述从链中的其他所述从链节点,以利用其他所述从链节点验证所述第一训练节点所对应的比较结果是否为真值;若超过第一预设比例的所述从链节点验证得到所述第一训练节点所对应的比较结果为真值,则进一步执行所述基于所述比较结果,根据预设处理策略对第一训练节点执行奖励数字代币或扣除数字代币的步骤。3.根据权利要求2所述的方法,其特征在于,所述根据预设处理策略对所述第一训练节点执行奖励数字代币或扣除数字代币之后,所述方法还包括:在所述从链中广播对所述第一训练节点的数字代币奖励结果或数字代币扣除结果。4.根据权利要求1所述的方法,其特征在于,所述比较所述待上传的第一本地参数和所述待验证的第一本地参数,获得比较结果,进一步包括:分别获取所述待上传的第一本地参数的第一哈希值和所述待验证的第一本地参数的第二哈希值;判断所述第一哈希值是否等于所述第二哈希值;若所述第一哈希值不等于所述第二哈希值,则确定所述第一本地参数被篡改;或,若所述第一哈希值等于所述第二哈希值,则确定所述第一本地参数未被篡改。5.根据权利要求4所述的方法,其特征在于,所述分别获取所述待上传的第一本地参数的第一哈希值和所述待验证的第一本地参数的第二哈希值,进一步包括:对所述待上传的第一本地参数进行哈希运算获得所述第一哈希值;自所述第一训练节点或所述从链的分布式账本上获取所述待验证的第一本地参数的第二哈希值。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:接收主链节点下发的对第二训练节点和/或所述共识节点的奖惩指令,并响应于所述奖惩指令执行扣除数字代币或奖励数字代币的操作。7.根据权利要求1所述的方法,其特征在于,所述第一本地参数是任意一个所述训练节点利用第一训练算法、第一类数据和第一初始参数进行模型训练获得的。8.一种具有奖惩机制的联邦学习方法,其特征在于,所述方法是由主链中的主链节点执行,所述主链中包括若干所述主链节点,每个所述主链节点能够与从链中的上传节点进行交互,所述方法包括:
主链节点获取第一预设数量的从链节点训练得到的目标本地参数;对所述第一预设数量的目标本地参数进行聚合,得到第一全局参数;分别确定每个所述目标本地参数对所述第一全局参数的贡献值;基于每个所述目标本地参数中对所述第一全局参数的贡献值,分别对各个所述目标本地参数对应的关联从链节点执行奖励数字代币或扣除数字代币,其中,所述目标本地参数对应的关联从链节点包括训练得到所述目标本地参数的训练节点和/或对所述目标本地参数进行共识验证的共识节点。9.根据权利要求8所述的方法,其特征在于,当所述目标本地参数对应的贡献值为正,则对所述目标本地参数对应的关联从链节点执行奖励数字代币的步骤,其中,奖励数字代币的数量与所述贡献值正相关;当所述目标本地参数对应的贡献值为负,则对所述目标本地参数对应的关联从链节点执行扣除数字代币的步骤,其中,扣除数字代币的数量与所述贡献值的绝对值正相关。10.根据权利要求8所述的方法,其特征在于,所述基于每个所述目标本地参数中对所述第一全局参数的贡献值,分别对各个所述目标本地参数对应的关联从链节点执行奖励数字代币或扣除数字代币,进一步包括:分别根据各个目标本地参数对所述第一全局参数的贡献值,分别确定对各个所述...

【专利技术属性】
技术研发人员:程晗蕾鲁静徐露张志明齐荣
申请(专利权)人:远光软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1