一种具有奖惩机制的联邦学习方法及相关装置制造方法及图纸

技术编号：33130080 阅读：61 留言：0更新日期：2022-04-17 00:45

本申请公开了一种具有奖惩机制的联邦学习方法及相关装置，该方法由从链中的上传节点执行，上传节点为从链中用于上传第一本地参数至主链中主链节点的从链节点，该方法包括：上传节点获取待上传的第一本地参数和待验证的第一本地参数，待上传的第一本地参数为通过共识验证的第一本地参数，待验证的第一本地参数为未经过共识验证的第一本地参数；比较待上传的第一本地参数和待验证的第一本地参数，获得比较结果，比较结果包括第一本地参数被篡改或第一本地参数未被篡改；基于比较结果根据预设处理策略对第一训练节点执行奖励或扣除数字代币，第一训练节点为训练得到第一本地参数的节点，该方案提高了各个从链节点参与联邦学习的积极性。的积极性。的积极性。

全部详细技术资料下载

【技术实现步骤摘要】
一种具有奖惩机制的联邦学习方法及相关装置

[0001]本申请涉及联邦学习
，特别是涉及一种具有奖惩机制的联邦学习方法及相关装置。

技术介绍

[0002]为了实现快速学习获得机器学习模型，Google人工智能实验室提出了联邦学习架构，具体是用于实现使得多个分散的客户端和一个中心服务器能够协作学习一个机器学习模型，用于提高学习模型的效率。但是，在现有的联邦学习架构中，参与机器学习模型训练的边缘终端设备提供的数据是否真实、数据样本是否足够大，对模型训练准确性至关重要。但是在现有的联邦学习架构中，都无法保证数据真实性和数据样本的足够强大，也无法提高参与联邦学习的边缘终端的积极性，故急需一种可以解决上述技术问题的技术方案。

技术实现思路

[0003]本申请主要解决的技术问题是提供一种具有奖惩机制的联邦学习方法及相关装置，可以提高各个从链节点参与联邦学习的积极性。
[0004]为解决上述技术问题，本申请采用的一个技术方案是：提供一种具有奖惩机制的联邦学习方法，所述方法是由从链中的上传节点执行，所述上传节点为...

【技术保护点】

【技术特征摘要】
1.一种具有奖惩机制的联邦学习方法，其特征在于，所述方法是由从链中的上传节点执行，所述上传节点为所述从链中用于上传第一本地参数至主链中的主链节点的从链节点，所述从链中的从链节点包括若干训练节点和若干共识节点，所述方法包括：所述上传节点获取待上传的第一本地参数和待验证的第一本地参数，其中，所述待上传的第一本地参数为通过所述若干共识节点共识验证的第一本地参数，所述待验证的第一本地参数为未经过所述共识验证的第一本地参数；比较所述待上传的第一本地参数和所述待验证的第一本地参数，获得比较结果，所述比较结果包括所述第一本地参数被篡改或所述第一本地参数未被篡改；基于所述比较结果，根据预设处理策略对第一训练节点执行奖励数字代币或扣除数字代币，其中，所述第一训练节点为训练得到所述第一本地参数的所述训练节点。2.根据权利要求1所述的方法，其特征在于，所述获得比较结果之后，所述方法还包括：将所述第一本地参数对应的比较结果广播至所述从链中的其他所述从链节点，以利用其他所述从链节点验证所述第一训练节点所对应的比较结果是否为真值；若超过第一预设比例的所述从链节点验证得到所述第一训练节点所对应的比较结果为真值，则进一步执行所述基于所述比较结果，根据预设处理策略对第一训练节点执行奖励数字代币或扣除数字代币的步骤。3.根据权利要求2所述的方法，其特征在于，所述根据预设处理策略对所述第一训练节点执行奖励数字代币或扣除数字代币之后，所述方法还包括：在所述从链中广播对所述第一训练节点的数字代币奖励结果或数字代币扣除结果。4.根据权利要求1所述的方法，其特征在于，所述比较所述待上传的第一本地参数和所述待验证的第一本地参数，获得比较结果，进一步包括：分别获取所述待上传的第一本地参数的第一哈希值和所述待验证的第一本地参数的第二哈希值；判断所述第一哈希值是否等于所述第二哈希值；若所述第一哈希值不等于所述第二哈希值，则确定所述第一本地参数被篡改；或，若所述第一哈希值等于所述第二哈希值，则确定所述第一本地参数未被篡改。5.根据权利要求4所述的方法，其特征在于，所述分别获取所述待上传的第一本地参数的第一哈希值和所述待验证的第一本地参数的第二哈希值，进一步包括：对所述待上传的第一本地参数进行哈希运算获得所述第一哈希值；自所述第一训练节点或所述从链的分布式账本上获取所述待验证的第一本地参数的第二哈希值。6.根据权利要求1所述的方法，其特征在于，所述方法还包括：接收主链节点下发的对第二训练节点和/或所述共识节点的奖惩指令，并响应于所述奖惩指令执行扣除数字代币或奖励数字代币的操作。7.根据权利要求1所述的方法，其特征在于，所述第一本地参数是任意一个所述训练节点利用第一训练算法、第一类数据和第一初始参数进行模型训练获得的。8.一种具有奖惩机制的联邦学习方法，其特征在于，所述方法是由主链中的主链节点执行，所述主链中包括若干所述主链节点，每个所述主链节点能够与从链中的上传节点进行交互，所述方法包括：
主链节点获取第一预设数量的从链节点训练得到的目标本地参数；对所述第一预设数量的目标本地参数进行聚合，得到第一全局参数；分别确定每个所述目标本地参数对所述第一全局参数的贡献值；基于每个所述目标本地参数中对所述第一全局参数的贡献值，分别对各个所述目标本地参数对应的关联从链节点执行奖励数字代币或扣除数字代币，其中，所述目标本地参数对应的关联从链节点包括训练得到所述目标本地参数的训练节点和/或对所述目标本地参数进行共识验证的共识节点。9.根据权利要求8所述的方法，其特征在于，当所述目标本地参数对应的贡献值为正，则对所述目标本地参数对应的关联从链节点执行奖励数字代币的步骤，其中，奖励数字代币的数量与所述贡献值正相关；当所述目标本地参数对应的贡献值为负，则对所述目标本地参数对应的关联从链节点执行扣除数字代币的步骤，其中，扣除数字代币的数量与所述贡献值的绝对值正相关。10.根据权利要求8所述的方法，其特征在于，所述基于每个所述目标本地参数中对所述第一全局参数的贡献值，分别对各个所述目标本地参数对应的关联从链节点执行奖励数字代币或扣除数字代币，进一步包括：分别根据各个目标本地参数对所述第一全局参数的贡献值，分别确定对各个所述...

【专利技术属性】
技术研发人员：程晗蕾，鲁静，徐露，张志明，齐荣，
申请(专利权)人：远光软件股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人