当前位置: 首页 > 专利查询>贵州大学专利>正文

一种基于区块链与联邦学习的多方安全数据共享方法技术

技术编号:36089528 阅读:44 留言:0更新日期:2022-12-24 11:06
本发明专利技术公开了一种基于区块链与联邦学习的多方安全数据共享方法。该方法实施步骤如下:数据请求者向其附近的超级节点发出一个数据共享请求,一旦附近的超级节点接收到数据共享请求,它会验证请求者的ID,并对区块链进行检索以确认在此之前该请求是否被处理过。在该过程中,由委员会节点验证分布式数据提供者的模型更新并执行共识过程。数据请求者和数据提供者之间的数据共享事件以事务的形式生成,并在区块链中广播。最后,系统上传全局模型到区块链,返回结果给任务请求者。数值结果表明,该发明专利技术能有效防止工业物联网数据中毒攻击,可以有效降低共识计算量,提高模型更新的隐私保护能力,实现工业物联网数据的多方安全共享。实现工业物联网数据的多方安全共享。实现工业物联网数据的多方安全共享。

【技术实现步骤摘要】
一种基于区块链与联邦学习的多方安全数据共享方法


[0001]本专利技术属于工业物联网领域,具体涉及一种基于区块链与联邦学习的多方安全数据共享方法。

技术介绍

[0002]工业物联网中的数据具有规模大、实时性高、结构复杂的特点,使得工业物联网的安全性和安全需求得到了前所未有的增长。因此,如何在工业物联网中保护和使用这些有价值的数据,以高效、安全、经济的方式共享成为数据所有者和提供商亟待解决的问题。近年来,随着人工智能的发展,人们开始关注基于机器学习的隐私保护。区块链具有去中心化、不可篡改、开放透明和可追溯性等特性,最近被用于工业物联网的联邦学习,以提供数据完整性和激励,吸引足够的客户数据和计算资源用于模型训练。但工业物联网应用需要系统的、整体的体系结构设计来支持系统的开发以及有效的方法来解决工业物联网设备的多方数据共享中数据异构的挑战,而在多个不受信任方之间进行分布式数据共享则需要新的联邦学习机制。2019年Li等人在论文《Smartpc:Hierarchical pace control in real

time federated learning system》中为分层在线速度的智能PC控制框架提出了联邦学习策略,在节约能源的同时平衡训练时间和模型精度。但在传统的联邦学习中,中央服务器将维护全局机器学习模型,这可能会带来不良的安全问题。2022年Feng等人在论文《Blockchain

empowered decentralized horizontal federated learning for 5g

enabled UAVs》针对5G无人机提出了一种区块链授权的分散跨域联邦学习框架,并利用同态加密和多方计算抵御对本地更新的攻击。
[0003]作为解决计算和存储资源受限问题的一种方法,区块链在分布式场景中协同使用数据有广泛的应用。但分布式多方数据共享在工业物联网中的应用也仍然面临着一些挑战:一是现有工作通常针对中央服务器或协作者的攻击威胁,而忽略了不诚实协作者破坏联合建模过程所造成的模型质量问题;二是数据提供者在分布式多方数据共享过程中对数据隐私泄露的担忧,导致数据提供者共享数据的意愿持续下降。
[0004]综上所述,虽然研究人员们取得了最新的进展和研究成果,但联邦学习中存在的一些分布式安全和效率漏洞,例如共识代价和中毒攻击,这些都还有待改进。通过提供基于区块链的安全模型共享和具有多重隐私保护的联邦学习,在解决分布式安全和效率漏洞问题上会有一定的帮助。

技术实现思路

[0005]本专利技术的目的是提出一种基于区块链与联邦学习的多方安全数据共享方法,以解决上述技术问题。
[0006]为实现上述目的,本专利技术提供了如下方案:
[0007]一种基于区块链与联邦学习的多方安全数据共享方法,该方法包括构建基于区块链与联邦学习的多方安全数据共享模型,该模型可分为两个阶段:数据共享阶段、共识阶
段。
[0008](1)数据共享阶段
[0009]采用该方法进行一次数据共享的步骤分为:数据共享任务初始化、数据检索、本地模型训练、全局模型聚合、结果反馈;具体过程如下:
[0010](1.1)数据共享任务初始化
[0011]任务发起者r向其附近的超级节点SN
req
发出一个数据共享请求Req={r1,r2,...,r
n
},并支付一定数量的代币。请求包含r的ID,数据类别和时间戳,r使用私钥SK
r
的数字签名。
[0012](1.2)数据检索
[0013]一旦附近的节点SN接收到数据共享请求,它会验证请求者r的ID,并对区块链进行检索以确认在此之前该请求是否被处理过。如果有记录,将从区块链下载模型作为请求r
i
的应答返回。
[0014](1.3)本地模型训练
[0015]各相关参与节点分别采用梯度下降法进行模型训练。每个参与者使用它的本地数据集和初始模型参数w
ini
进行本地模型训练。在t轮迭代中,每个参与节点p
i
∈P通过计算局部梯度下降根据w
i
(t

1)在其本地数据D
i
上训练一个本地数据模型w
i
(t),如下式所示:
[0016][0017]其中,γ为分布式梯度下降的学习率。
[0018]然后p
i
将训练好的模型参数w
i
(t)发送给其他参与者,并上传到区块链进行进一步的验证和聚合。
[0019](1.4)全局模型聚合
[0020]一旦接收到模型参数w
i
(t),p
i+1
将根据w
i
(t)使用其本地数据D
i+1
训练一个新的本地数据模型w
i
(t+1),并向其他参与者广播w
i
(t+1)。数据模型在参与者之间进行迭代训练。最后,将参与节点的本地模型w
i
(t)进行加权,得到全局模型w(t),如下式所示:
[0021][0022]其中,N为节点数量,C
i
为节点i在t轮迭代中对整个训练过程的贡献。
[0023](1.5)结果反馈
[0024]数据请求者和数据提供者之间的数据共享事件以事务的形式生成,并在区块链中广播。所有记录收集成区块,由收集节点进行加密和签名。经过多次迭代训练,得到了请求任务对应的全局数据模型w(t)。系统根据每个参与者的贡献度,将任务请求者支付的代币作为奖励分配给参与模型训练的数据持有者,这可以激励下次数据持有者积极参与请求任务的模型训练。最后,系统上传并存储全局模型w(t)到区块链,返回结果w(t)给任务请求者。
[0025](2)共识阶段
[0026]采用该方法达成一次有效共识的步骤分为:委员会节点及领导选择、本地模型训
练、模型更新验证;具体过程如下:
[0027](2.1)委员会节点及领导选择
[0028]共识过程是由选定的委员会根据模型训练的质量来选举的。委员会节点是所有参与者节点的一个子集,负责驱动整个共识过程并对请求的数据模型进行学习。准确率最高的委员会节点将作为领导者,汇总这些本地更新,并将汇总结果发送给其他委员会节点进行验证,其余的委员会节点则作为当前共识过程的跟随者。
[0029](2.2)本地模型训练
[0030]各参与节点p
i
协作训练由数据共享任务请求者发布的初始化全局模型w
ini
,并迭代生成他们自己的本地模型更新w
i
。然后,各参与节点将其的本地模型更新w
i
和数字签名上传到委员会。交易表示FL过程中更新的本地模型w
i
(t)的参数,可以记录为ENC(sk
i
(t...

【技术保护点】

【技术特征摘要】
1.一种基于区块链与联邦学习的多方安全数据共享方法,其特征在于,所述方法包括构建基于区块链与联邦学习的多方安全数据共享模型,该模型分为两个阶段:数据共享阶段和共识阶段;该方法包括如下步骤:数据请求者向其附近的超级节点发出一个数据共享请求,一旦附近的超级节点接收到数据共享请求,它会验证请求者的ID,并对区块链进行检索以确认在此之前该请求是否被处理过;如果有记录,将从区块链下载模型作为请求的应答返回;若无,则选择各相关参与节点采用分布梯度下降法进行模型训练;在该过程中,由委员会节点验证分布式数据提供者的模型更新并执行共识过程;数据请求者和数据提供者之间的数据共享事件以事务的形式生成,并在区块链中广播;最后,系统上传全局模型到区块链,返回结果给任务请求者。2.根据权利要求1所述的基于区块链与联邦学习的多方安全数据共享方法,其特征在于,在数据共享阶段中,进行一次数据共享的步骤分为:数据共享任务初始化、数据检索、本地模型训练、全局模型聚合、结果反馈;其中,所述数据共享任务初始化包括:任务发起者r向其附近的超级节点SN
req
发出一个数据共享请求Req={r1,r2,...,r
n
},并支付一定数量的代币;请求包含r的ID,数据类别和时间戳,r使用私钥SK
r
的数字签名。3.根据权利要求2所述的基于区块链与联邦学习的多方安全数据共享方法,其特征在于,所述数据检索包括:附近的节点SN接收到数据共享请求,它会验证请求者r的ID,并对区块链进行检索以确认在此之前该请求是否被处理过;如果有记录,将从区块链下载模型作为请求r
i
的应答返回。4.根据权利要求2所述的基于区块链与联邦学习的多方安全数据共享方法,其特征在于,所述本地模型训练包括:各相关参与节点分别采用梯度下降法进行模型训练;每个参与者使用它的本地数据集和初始模型参数w
ini
进行本地模型训练;在t轮迭代中,每个参与节点p
i
∈P通过计算局部梯度下降根据w
i
(t

1)在其本地数据D
i
上训练一个本地数据模型w
i
(t),如下式所示:其中,γ为分布式梯度下降的学习率;然后p
i
将训练好的模型参数w
i
(t)发送给其他参与者,并上传到区块链进行进一步的验证和聚合。5.根据权利要求2所述的基于区块链与联邦学习的多方安全数据共享方法,其特征在于,所述全局模型聚合包括:一旦接收到模型参数w
i
(t),p
i+1
将根据w
i
(t)使用其本地数据D
i+1
训练一个新的本地数据模型w
i
(t+1),并向其他参与者广播w
i
(t+1);数据模型在参与者之间进行迭代训练;最后,将参与节点的本地模型w
i
(t)进行加权,得到全局模型w(t),如下式所示:其中,N为节点数量,C
i
为节点i在t轮迭代中对整个训练过程的贡献。6.根据权利要求2所述的基于区块链与联邦学习的多方安全数据共享方法,其特征在于,所述结果反馈包括:数据请求者和数据提供者之间的数据共享事件以事务的形式生成,
并在区块链中广播;所有记录收集成区块,由收集节点进行加密和签名;经过多次迭代训练,得到了请求任务对应的全局数据模型w(t);系统根据每个参与者的贡献度,将任务请求者支付的代币作为奖励分配给参...

【专利技术属性】
技术研发人员:彭长根龙洋洋陈玉玲谭伟杰豆慧
申请(专利权)人:贵州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1