【技术实现步骤摘要】
一种基于区块链的深度神经网络模型联邦重组方法及系统
[0001]本专利技术属于联邦深度学习和区块链领域,涉及一种基于区块链的深度神经网络模型联邦重组方法及系统。
技术介绍
[0002]区块链技术是一种分布式数据库技术,最初是为了支持加密货币比特币的交易而开发的。比特币的创始人中本聪提出了一种去中心化的数字货币系统,利用区块链技术来保证交易的安全性和可靠性。区块链技术的核心是去中心化的数据管理,不同于传统的中心化数据管理方式,区块链技术通过分布式网络的方式将数据存储在多个节点上,保证了数据的不可篡改性和安全性。
[0003]深度神经网络模型重组是一种深度神经模型重用任务。随着深度学习的快速发展,网上的预训练的深度神经网络模型数量庞大,复用预模型可以降低从头开始训练新模型的成本。模型重组的目标是,在仅有源模型及其推理输出结果且源模型的训练数据无法获取条件下,提取处理不同任务的多个源模型的知识,将其融合到单个紧凑的目标模型中,从而得到一个能以高性能处理所有源任务的轻量级目标模型。
[0004]模型重组任务均只在单节点上实施,但单节点用户的算力和数据的有限性限制了模型重组的进一步扩展,且目标任务的设置较为局限。联邦学习方法建立在多节点之间已经相互信任的基础上,但这个信任基础无法在整个网络的多节点之间达到,并且融合过程中无法保证节点间数据共享的安全性。同时模型联邦重组需要对参与模型重组过程的节点进行一个公平合理的贡献分配。
技术实现思路
[0005]为解决上述问题,本专利技术提供一种基于区块链的 ...
【技术保护点】
【技术特征摘要】
1.一种基于区块链的深度神经网络模型联邦重组方法,包含如下步骤:步骤1.基于Hyperledger Fabric框架构建符合模型联邦重组合作的联盟链;联盟链由联盟成员以及负责联盟链的维护与更新的联盟操作员、智能合约审计人员、区块链开发人员共四种角色共同构成,参与模型联邦重组合作的节点作为联盟成员;Hyperledger Fabric框架是一个联盟链的基本框架,提供权限管理、账本维护、智能合约等区块链技术,使用者只需设置相应的业务逻辑;在此框架基础上,设置联盟成员间的业务为模型联邦重组合作,业务由客户方发布,由模型训练方以及模型重组验证方接收,三者通过智能合约达成合作,由此构建出模型联邦重组的联盟链;步骤2.设置模型联邦重组的智能合约;智能合约在客户方、模型训练方以及模型重组验证方之间签订,并根据设置内容自动执行,达成三方合作与约束,确保模型联邦重组过程中的安全性;步骤3.存储模型联邦重组过程中的数据;客户方与模型重组验证方之间的探测数据、目标模型共享,以及模型训练方与模型重组验证方之间的源模型共享,通过分散式存储(DS)系统实现,以确保数据和私有机器学习模型共享的安全性;DS系统使这些数据和学习模型的访问更实惠、更快、更安全,更能满足联邦学习过程中的通信需求;节点将数据或私有模型存储在DS系统中后,会生成表征这些网络资产的唯一哈希值地址并进行共享,保证了共享过程的完整性和授权;步骤4.训练模型训练方的源模型,交由模型重组验证方进行联邦重组;模型联邦重组分为两个部分,一部分为源模型训练任务,另一部分为联邦重组源模型并验证而得到目标模型;两部分分别由模型训练方和模型重组验证方完成,由模型训练方提供模型重组验证方所需的源模型;源模型训练由本地预训练及知识蒸馏两个步骤完成;模型训练方基于本地数据,训练得到本地预训练模型,用M={M1,M2,
…
,M
N
}表示N个模型训练方节点的本地预训练模型;为保证隐私性,对本地预训练模型进行知识蒸馏,从而得到源模型,提供给模型重组验证方进行联邦重组及验证过程;源模型通过基于特征的知识蒸馏方法从本地预训练模型中学习知识;知识蒸馏过程中,由于网络结构的异构性,使用翻译模块对齐本地预训练模型和源模型的特征输出维度,将源模型输出通过翻译模块转换为预定义的输出长度;设和分别表示第n个节点的源模型和本地预训练模型M
n
的长度对齐后的特征;分别表示第t次与模型重组验证方通讯时,第n个节点的源模型和本地预训练模型参数;X为模型M
n
的训练数据;同时,使源模型的中间输出模仿预训练模型,设置特征知识蒸馏损失计算如下:源模型参数更新采用梯度下降如下:经过本地知识提炼,源模型参数上传到星际文件系统作为模型重组验证方的源模型,模型重组验证方通过模型训练方提供的唯一的哈希地址获取模型参数;步骤5.模型联邦重组,模型重组验证方对源模型进行联邦重组,进而得到目标模型;
源模型从步骤4所得,交由模型重组验证方进行模型联邦重组;模型训练方提供的源模型基于不同的本地数据训练而得,需要选择对目标模型更有利的模型进行联邦重组,所以模型联邦重组有以下两个步骤:(1)选择源模型集合中的有利模型,用于联邦重组;(2)联邦重组选取的源模型,验证重组后获得的目标模型性能;步骤6计算模型训练方的贡献值;根据在步骤5中的各模型训练方提供的源模型的可迁移性分数和联邦重组过程中的目标模型性能指标提升数,进行归一化计算,得到每个模型训练方为目标模型的贡献度量;用R
t,i
表示模型训练方和模型重组验证方第i个模型训练方节点在第t次联邦通讯迭代的贡献值,贡献计算如下所示:R
t,i
=α*acc
t,i
+β*p
t,i
(3)其中acc
t,i
为被选中的源模型在步骤5.2使得目标模型性能提升数,p
t,i
为步骤5.1中被选取的源模型的可迁移性分数,若未被选中则p
t,i
=0,α,β分别为可变参数用于调整acc
t,i
,p
t,i
两个参数的权重比例且统一两个的数字量级;考虑到目标模型性能的增长为近似于对数非线性增长,不能直接累加平均每一次迭代得到贡献值,故采用带偏差矫正的指数移动平均方法,随着迭代次数增多,提升近期迭代的贡献值的权重,削减前期迭代中的贡献值的权重,最终第i个模...
【专利技术属性】
技术研发人员:宋明黎,王毅,宋杰,冯尊磊,陈刚,
申请(专利权)人:浙江大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。