基于联邦学习的模型训练方法、装置、系统、设备和介质制造方法及图纸

技术编号:30435676 阅读:18 留言:0更新日期:2021-10-24 17:35
本发明专利技术实施例涉及一种基于联邦学习的模型训练方法、装置、系统、设备和介质,具体涉及机器学习技术领域,方法包括:基于联邦学习的模型训练方法,其特征在于,由各私有云端服务器执行,包括:获取本地数据,将所获取的本地数据经过本地模型识别后,根据识别结果生成样本集共享给公有云端服务器,以使所述公有云端服务器采用所述样本集对联合模型进行训练并共享所述联合模型,其中所述样本集的数据量小于所述本地数据的数据量;下载所述联合模型,用所下载的联合模型替换本地模型。本发明专利技术实施例的技术方案能够在避免大量工业数据泄露的同时,保证了模型训练的效果。保证了模型训练的效果。保证了模型训练的效果。

【技术实现步骤摘要】
基于联邦学习的模型训练方法、装置、系统、设备和介质


[0001]本专利技术实施例涉及机器学习
,具体涉及一种基于联邦学习的模型训练方法、装置、系统、电子设备、及存储介质。

技术介绍

[0002]当前,工业企业纷纷加入工智能浪潮,但人工智能技术在工业场景落地效果不佳,其问题主要在于人工智能技术需要大量优质数据来提高智能水平。但从目前来看,绝大多数企业都存在数据量少、数据质量差的问题,不足以支撑人工智能技术的实现;同时国内外监管环境逐步加强数据保护,数据在安全合规的前提下自由流动是大势所趋;企业所拥有的数据往往都有巨大的潜在价值。
[0003]一方面,若两个企业甚至企业间的部门都不会提供各自数据共享,导致即使在同一个企业内,数据也往往以孤岛的形式出现。
[0004]另一方面,若各参与方都上传全部数据,将所有数据聚合训练得到虚拟模型,再反馈至各参与方共享最优模型,则需要各参与方上传所有数据,这会使占用的带宽较大,通信开销过大。

技术实现思路

[0005]有鉴于此,本专利技术实施例提供一种基于联邦学习的模型训练方法、装置、电子设备、及存储介质,以避免大量工业数据泄露的同时,保证了模型训练的效果。
[0006]本专利技术实施例的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本专利技术实施例的实践而习得。
[0007]在本公开的第一方面,本专利技术实施例提供了一种基于联邦学习的模型训练方法,由各私有云端服务器执行,包括:
[0008]获取本地数据,将所获取的本地数据经过本地模型识别后,根据识别结果生成样本集共享给公有云端服务器,以使所述公有云端服务器采用所述样本集对联合模型进行训练并共享所述联合模型,其中所述样本集的数据量小于所述本地数据的数据量;
[0009]下载所述联合模型,用所下载的联合模型替换本地模型。
[0010]于一实施例中,根据识别结果生成样本集共享给公有云端服务器包括:
[0011]根据本地模型不能识别的数据生成样本集共享给公有云端服务器;和/或
[0012]根据本地模型识别错误的数据生成样本集共享给公有云端服务器。
[0013]于一实施例中,在获取本地数据之后还包括:基于所述本地数据对本地模型进行训练,将训练后的本地模型算法参数发送给公有云端服务器,以使所述公有云端服务器验证是否需要采用所接收的所述算法参数更新联合模型算法参数。
[0014]于一实施例中,所述公有云端服务器验证是否需要采用所接收的所述算法参数更新联合模型算法参数包括:
[0015]采用先验数据集计算联合模型的效果指标得到第一指标值;
[0016]将联合模型算法参数替换为所接收的所述本地模型算法参数后,采用所述先验数据集计算替换算法参数后的联合模型的效果指标得到第二指标值;
[0017]根据所述第一指标值和所述第二指标值的大小确定是否需要采用所接收的所述本地模型算法参数更新联合模型。
[0018]于一实施例中,所述效果指标包括准确率和/或召回率。
[0019]于一实施例中,根据识别结果生成样本集共享给公有云端服务器包括:
[0020]根据识别结果生成样本集,将所述样本集加密后上链存储到区块链中共享给公有云端服务器。
[0021]在本公开的第二方面,本专利技术实施例还提供了一种基于联邦学习的模型训练装置,配置于各私有云端服务器中,所述装置包括:
[0022]训练样本上传单元,用于获取本地数据,将所获取的本地数据经过本地模型识别后,根据识别结果生成样本集共享给公有云端服务器,以使所述公有云端服务器采用所述样本集对联合模型进行训练并共享所述联合模型,其中所述样本集的数据量小于所述本地数据的数据量;
[0023]模型下载单元,用于下载所述联合模型,用所下载的联合模型替换本地模型。
[0024]于一实施例中,所述训练样本上传单元用于根据识别结果生成样本集共享给公有云端服务器包括,用于:
[0025]根据本地模型不能识别的数据生成样本集共享给公有云端服务器;和/或
[0026]根据本地模型识别错误的数据生成样本集共享给公有云端服务器。
[0027]于一实施例中,所述训练样本上传单元还用于,在获取本地数据之后,基于所述本地数据对本地模型进行训练,将训练后的本地模型算法参数发送给公有云端服务器,以使所述公有云端服务器验证是否需要采用所接收的所述算法参数更新联合模型算法参数。
[0028]于一实施例中,所述训练样本上传单元中,所述公有云端服务器验证是否需要采用所接收的所述算法参数更新联合模型算法参数包括:
[0029]采用先验数据集计算联合模型的效果指标得到第一指标值;
[0030]将联合模型算法参数替换为所接收的所述本地模型算法参数后,采用所述先验数据集计算替换算法参数后的联合模型的效果指标得到第二指标值;
[0031]根据所述第一指标值和所述第二指标值的大小确定是否需要采用所接收的所述本地模型算法参数更新联合模型。
[0032]于一实施例中,所述效果指标包括准确率和/或召回率。
[0033]于一实施例中,所述训练样本上传单元用于根据识别结果生成样本集共享给公有云端服务器包括:
[0034]用于根据识别结果生成样本集,将所述样本集加密后上链存储到区块链中共享给公有云端服务器。
[0035]在本公开的第三方面,本专利技术实施例还提供了一种基于联邦学习的模型训练系统,包括公有云端服务器和多个私有云端服务器;
[0036]各私有云端服务器获取本地数据,将所获取的本地数据经过本地模型识别后,根据识别结果生成样本集共享给公有云端服务器,其中所述样本集的数据量小于所述本地数据的数据量;
[0037]所述公有云端服务器采用所述样本集对联合模型进行训练并共享所述联合模型;
[0038]各私有云端服务器从所述公有云端服务器下载所述联合模型,用所下载的联合模型替换本地模型。
[0039]于一实施例中,所述公有云端服务器采用所述样本集对联合模型进行训练之前还包括,判断所述样本集是否需要训练;
[0040]若判断所述样本集需要训练,再采用所述样本集对联合模型进行训练。
[0041]于一实施例中,所述根据识别结果生成样本集共享给公有云端服务器包括:
[0042]根据识别结果生成样本集,将所述样本集加密后上链存储到区块链中共享给公有云端服务器。
[0043]在本公开的第四方面,提供了一种电子设备。该电子设备包括:处理器;以及存储器,用于存储可执行指令,所述可执行指令在被所述处理器执行时使得所述电子设备执行第一方面中的方法。
[0044]在本公开的第五方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现第一方面中的方法。
[0045]本专利技术实施例提出的技术方案的有益技术效果是:
[0046]本专利技术实施例通过各私有云端服务器获取本地数据,将所获取的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习的模型训练方法,其特征在于,由各私有云端服务器执行,包括:获取本地数据,将所获取的本地数据经过本地模型识别后,根据识别结果生成样本集共享给公有云端服务器,以使所述公有云端服务器采用所述样本集对联合模型进行训练并共享所述联合模型,其中所述样本集的数据量小于所述本地数据的数据量;下载所述联合模型,用所下载的联合模型替换本地模型。2.根据权利要求1所述的方法,其特征在于,根据识别结果生成样本集共享给公有云端服务器包括:根据本地模型不能识别的数据生成样本集共享给公有云端服务器;和/或根据本地模型识别错误的数据生成样本集共享给公有云端服务器。3.根据权利要求1所述的方法,其特征在于,所述根据识别结果生成样本集共享给公有云端服务器包括:根据识别结果生成样本集,将所述样本集加密后上链存储到区块链中共享给公有云端服务器;在获取本地数据之后还包括:基于所述本地数据对本地模型进行训练,将训练后的本地模型算法参数发送给公有云端服务器,以使所述公有云端服务器验证是否需要采用所接收的所述算法参数更新联合模型算法参数。4.根据权利要求3所述的方法,其特征在于,所述公有云端服务器验证是否需要采用所接收的所述算法参数更新联合模型算法参数包括:采用先验数据集计算联合模型的效果指标得到第一指标值,其中所述效果指标包括准确率和/或召回率;将联合模型算法参数替换为所接收的所述本地模型算法参数后,采用所述先验数据集计算替换算法参数后的联合模型的效果指标得到第二指标值;根据所述第一指标值和所述第二指标值的大小确定是否需要采用所接收的所述本地模型算法参数更新联合模型。5.一种基于联邦学习的模型训练装置,其特征在于,配置于各私有云端服务器中,所述装置包括:训练样本上传单元...

【专利技术属性】
技术研发人员:陈录城李晓璐张成龙孙明贾淇超诸葛慧玲
申请(专利权)人:海尔卡奥斯物联生态科技有限公司海尔数字科技青岛有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1