当前位置: 首页 > 专利查询>浙江大学专利>正文

基于区块链的联邦学习数据参与方贡献值计算和激励方法技术

技术编号:28422434 阅读:123 留言:0更新日期:2021-05-11 18:30
本发明专利技术公开一种基于区块链的联邦学习数据参与方贡献值计算和激励方法,该方法包括步骤:对数据参与方的本地训练模型进行特征提取,获得模型更新数据;数据需求方对所述模型更新数据解码,得到中间验证模型;数据需求方对中间验证模型分批次评估得到评估指标;根据所述评估指标计算所述数据参与方的贡献度;根据所述数据参与方的贡献度向数据参与方分配激励值;将数据参与方的激励值和地址形成奖励队列放入区块链上。本发明专利技术以由数据需求方对数据参与方的贡献进行评估和计算,再以各方贡献为分配依据进行奖励的分配,保证公平性,同时提高数据拥有方参与联邦学习的热情;有效地鼓励和吸引数据拥有方参与到联邦学习中来。

【技术实现步骤摘要】
基于区块链的联邦学习数据参与方贡献值计算和激励方法
本专利技术涉及联邦学习
,具体涉及一种基于区块链的联邦学习数据参与方贡献值计算和激励方法。
技术介绍
近几年人工智能技术快速发展,在各行各业得到了很大的应用,借助大数据环境驱动的人工智能进入了黄金发展时期。目前存在的一些潜在的问题可能造成大数据驱动的人工智能技术进入发展低谷,需要面对和解决:一是数据源的问题,包括有限的数据量和数据的质量问题。在很多行业,数据是以数据孤岛的形式存在的,行业之间甚至行业内数据的整合存在的重重障碍。二是数据隐私和数据安全问题。如何在保证数据隐私和安全的情况下有效地整合和利用数据是当前不得不面对的难题。针对这两个问题,谷歌Google在2016年提出了联邦学习(FederatedLearning),有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下,进行数据使用和机器学习建模。联邦学习定义了机器学习框架,在此框架下通过设计虚拟模型解决不同数据拥有方在不交换数据的情况下进行协作的问题。虚拟模型是各方将数据聚合在一起的最优模型,各自区域依据模型为本地目标服务。联邦学习要求此建模结果应当无限接近传统模式,即将多个数据拥有方的数据汇聚到一处进行建模的结果。在联邦机制下,各参与者的身份和地位相同,可建立共享数据策略,由于数据不发生转移,因此不会泄露用户隐私或影响数据规范。但是传统联邦学习缺少鼓励和吸引数据拥有方参与到联邦学习中来的激励机制,为联邦学习框架引入激励机制可以有效地提高联邦学习获得信息的能力。CN111967610A公开了一种基于区块链的联邦学习激励方法、装置、设备及存储介质,其中,该方法包括:获取各个参与方的本地数据和本地模型;基于联邦学习框架对所有参与方的本地数据进行训练,得到联邦模型;分别计算各个本地模型的性能指数,计算联邦模型的性能指数;针对每个参与方,根据该参与方的本地模型的性能指数和联邦模型的性能指数,计算该参与方的本地数据对所述联邦学习框架的数据贡献度;根据各个参与方的数据贡献度,向各个参与方分配激励值,将相关数据存区块链上。该方案促使参与方更加积极地为联邦学习提供数据,有利于优化联邦模型,有利于联邦学习框架的推广,该方法具有准确性、可靠性。该方法通过将参与方的数据贡献度与本地模型的性能和联邦模型的性能关联起来,而不考虑各个参与方提供数据的质量和数量,使得将数据贡献度量化问题转化为数值化、简单化。参与方的贡献度计算仅仅考虑了训练效果即模型性能,贡献度由效果评估指标(性能指数)直接导出。评估方法和奖励机制存在不准确、不公平。同时该方法中将包括联邦学习过程中的模型信息、参与方的训练后模型、测试数据以及贡献度等都存放在区块链中,因区块链的公开性,可能存在学习模型甚至数据隐私泄露的风险。综上所述,本专利技术专利设计了一种联邦学习框架中的数据参与方贡献计算和和激励算法(即本专利技术专利所述的基于区块链技术的联邦学习数据参与方贡献计算及激励方法)。本专利技术专利认为在激励参与方时应该根据参与方所做的贡献进行分配,参与方贡献大小由其提供的数据和模型的训练效果决定,提供的数据和模型的训练效果能够较好地反映参与方的成本和贡献。引入数字货币作为激励手段,本专利技术专利认为相较于以往联邦学习框架,该方法能够有效地吸引数据拥有方参与到联邦学习的体系中。
技术实现思路
本专利技术目的在于解决联邦学习中缺少鼓励和吸引数据拥有方参与到联邦学习中来的激励机制,提供一种基于区块链技术的联邦学习数据参与方贡献计算及激励方法,该方法在奖励参与方时根据参与方所做的贡献进行奖励分配,参与方贡献大小由其提供的数据和模型的训练效果决定,数据方提供的数据和模型的训练效果能够较好地反映参与方的成本和贡献,能够体现收益分配的公平性;该方法基于区块链技术引入数字货币作为激励手段,鼓励和吸引数据拥有方参与到联邦学习中来,此外,区块链去中心化、透明和不可篡改的特点能够有效地保证联邦学习数字货币体系的安全性。为实现上述目的,本专利技术采用的技术方案是:一种基于区块链的联邦学习数据参与方贡献值计算和激励方法,该方法包括:对数据参与方的本地训练模型进行特征提取,获得模型更新数据;数据需求方对所述模型更新数据解码,得到中间验证模型;数据需求方对中间验证模型分批次评估,得到评估指标;根据所述评估指标计算所述数据参与方的贡献度;根据所述数据参与方的贡献度,向数据参与方分配激励值;将数据参与方的激励值和地址形成奖励队列放入区块链上。为了有效地鼓励和吸引数据拥有方参与到联邦学习中来,公平的激励机制是有利的支撑,而为了做到对参与方进行公平的激励,需要合理的激励依据。本专利技术中数据参与方的贡献由数据参与方训练效果计算得到,作为奖励的分配依据;并按照益分配方法进行奖励的分配,保证公平性,同时提高数据拥有方参与联邦学习的热情。最后本专利技术将联邦学习对数据参与方的奖励以数字货币的形式进行发送,保存在区块链中。数据需求方在获得联邦学习对各个数据参与方的奖励信息后,便可以根据经典区块链的算法进行转账,以数字货币的形式奖励数据参与方。所述本地训练模型是数据参与方基于自身的本地数据对分发的模型训练得到。所述模型更新数据包括梯度变化、本地训练模型版本号、本地训练模型数据集大小、数据参与方身份识别、训练成本等信息。所述梯度变化采用梯度下降算法,具体为:δli=T′li-Tli其中,δli表示第i个数据参与方的第l轮次的梯度变化,T′li表示第i个数据参与方的第l轮次中本地数据训练后的梯度,Tli表示数据参与方第l轮次本地数据训练前的梯度。所述数据参与方的贡献度计算完成后,对梯度变化进行更新,更新方法为:其中,Tli表示第i个数据参与方的第l轮次的本地数据训练前的梯度,ηli表示第i个数据参与方的评估指标,δli表示第i个数据参与方第l轮次的梯度变化,N表示数据参与方的数量。所述评估设置边缘阈值thresbad和thresgood,当指标小于thresbad时,评价等级为bad;当指标大于thresgood时,评价等级为good;当指标处于两个阈值之间时,评价等级为uncertain,分别用阶跃函数b(aij)、g(aij)和u(aij)表示:对评估后的阶跃函数汇总、归一化处理,得到评估指标ηli,各类评估的出现次数汇总表示为:并对汇总结果进行归一化处理,表示为:根据各批次测试和评估结果得到第i个数据参与方第l轮次的评估指标ηli,表示为:ηli=normalgoodi+k*normaluncertaini其中,m表示数据需求方对中间验证模型共分m批次进行评估,j表示数据需求方第j批次评估,normalbadi表示第i个数据需求方评价等级为bad的归一化结果,normalgoodi表示第i个数据需求方评价等级为good的归一化结果,norma本文档来自技高网
...

【技术保护点】
1.一种基于区块链的联邦学习数据参与方贡献值计算和激励方法,其特征在于,该方法包括:/n对数据参与方的本地训练模型进行特征提取,获得模型更新数据;/n数据需求方对所述模型更新数据解码,得到中间验证模型;/n数据需求方对中间验证模型分批次评估,得到评估指标;/n根据所述评估指标计算所述数据参与方的贡献度;/n根据所述数据参与方的贡献度,向数据参与方分配激励值;/n将数据参与方的激励值和地址形成奖励队列放入区块链上。/n

【技术特征摘要】
1.一种基于区块链的联邦学习数据参与方贡献值计算和激励方法,其特征在于,该方法包括:
对数据参与方的本地训练模型进行特征提取,获得模型更新数据;
数据需求方对所述模型更新数据解码,得到中间验证模型;
数据需求方对中间验证模型分批次评估,得到评估指标;
根据所述评估指标计算所述数据参与方的贡献度;
根据所述数据参与方的贡献度,向数据参与方分配激励值;
将数据参与方的激励值和地址形成奖励队列放入区块链上。


2.根据权利要求1所述的基于区块链的联邦学习数据参与方贡献值计算和激励方法,其特征在于,所述本地训练模型是数据参与方基于自身的本地数据对分发的模型训练得到。


3.根据权利要求1所述的基于区块链的联邦学习数据参与方贡献值计算和激励方法,其特征在于,所述模型更新数据包括梯度变化、本地训练模型版本号、本地训练模型数据集大小、数据参与方身份识别。


4.根据权利要求3所述的基于区块链的联邦学习数据参与方贡献值计算和激励方法,其特征在于,所述梯度变化采用梯度下降算法,具体为:
δli=T′li-Tli
其中,δli表示第i个数据参与方的第l轮次的梯度变化,T′li表示第i个数据参与方的第l轮次中本地数据训练后的梯度,Tli表示数据参与方第l轮次本地数据训练前的梯度。


5.根据权利要求1或3所述的基于区块链的联邦学习数据参与方贡献值计算和激励方法,其特征在于,所述数据参与方的贡献度计算完成后,对梯度变化进行更新,更新方法为:



其中,Tli表示第i个数据参与方的第l轮次的本地数据训练前的梯度,ηli表示第i个数据参与方的评估指标,δli表示第i个数据参与方第l轮次的梯度变化,N表示数据参与方的数量。


6.根据权利要求1所述的基于区块链的联邦学习数据参与方贡献值计算和激励方法,其特征在于,所述评估设置边缘阈值thresbad和thresgood,当指标小于thresbad时,评价等级为bad;当指标大于thresgood时,评价等级为good;当指标处于两个阈值之间时,评价等级为uncertain,分别用阶跃函数...

【专利技术属性】
技术研发人员:孙凌云王鑫余芸萧展辉杨漾邵明陈波敖知琪周泽宝任昊文崔焱甘杉邹文景孙刚杨晓雪
申请(专利权)人:浙江大学南方电网数字电网研究院有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1