基于知识联邦的多端模型压缩方法、任务预测方法、装置及电子设备制造方法及图纸

技术编号：26651279 阅读：13 留言：0更新日期：2020-12-09 00:52

本发明专利技术公开了一种基于知识联邦的多端模型压缩方法、任务预测方法、装置及电子设备，其中多端模型压缩方法包括：将多个参与方上报的第N轮训练后的本地模型进行聚合得到全局待压缩模型，所述N大于或等于1；采用公共数据集基于预设性能指标对所述全局待压缩模型进行压缩，得到全局压缩模型，所述预设性能指标用于表征全局压缩模型在进行预测时的性能指标，所述公共数据集是通过对所述多个参与方的数据进行数据增强后得到的；将所述全局压缩模型发送至所述多个参与方以进行N+1轮训练。

全部详细技术资料下载

【技术实现步骤摘要】
基于知识联邦的多端模型压缩方法、任务预测方法、装置及电子设备
本专利技术涉及人工智能
，具体涉及到一种多端模型压缩方法、任务预测方法、装置及电子设备。
技术介绍
随着人工智能(AI)走向成熟，人们见识到了人工智能(AI)在复杂应用场景下的巨大潜力。例如无人汽车驾驶、医疗保健、金融数据分析等等。人们希望探索人工智能更深层次的优势，提升模型的鲁棒性和准确性。当前对人工智能的兴趣是由大数据所驱动的：2016年，AlphaGo总共使用了300,000个棋局作为训练数据，以取得出色的成绩。有了AlphaGo的成功，人们自然希望，像AlphaGo这样的大数据驱动型AI能够在我们生活的各个方面早日实现。但是，现实世界中的情况有些令人失望：除少数行业外，大多数领域的数据有限或数据质量较差。当今的AI仍然面临两个主要挑战。一是在大多数行业中，数据以孤立的孤岛形式存在。另一个是加强数据隐私和安全性。如何合理地解决AI行业数据孤岛和数据安全问题是AI研究人员和从业人员面临的主要挑战。基于知识联邦的多端联合训练的方式作为解决上述问题的一种解决方案，能够保证隐私数据不进行交换的前提下，多个参与方之间合作建立全局模型，使得全局模型能够得到充分的训练。以知识联邦中的模型层联邦为例，模型层联邦可以在实现多个参与方之间合作建立全局模型的前提下能够加强数据隐私和安全性以及解决数据孤岛问题。然而，在对模型进行训练时，由于多方参与训练，需要频繁的通信和加密数据交换，因而带来了对于通信量的巨大挑战。并且，随着数据量以及参...

【技术保护点】
1.一种基于知识联邦的多端模型压缩方法，其特征在于，包括：/n将多个参与方上报的第N轮训练后的本地模型进行聚合得到全局待压缩模型，所述N大于或等于1；/n采用公共数据集基于预设性能指标对所述全局待压缩模型进行压缩，得到全局压缩模型，所述预设性能指标用于表征全局压缩模型在进行预测时的性能指标，所述公共数据集是通过对所述多个参与方的数据进行数据增强后得到的；/n将所述全局压缩模型发送至所述多个参与方以进行N+1轮训练。/n

【技术特征摘要】
1.一种基于知识联邦的多端模型压缩方法，其特征在于，包括：
将多个参与方上报的第N轮训练后的本地模型进行聚合得到全局待压缩模型，所述N大于或等于1；
采用公共数据集基于预设性能指标对所述全局待压缩模型进行压缩，得到全局压缩模型，所述预设性能指标用于表征全局压缩模型在进行预测时的性能指标，所述公共数据集是通过对所述多个参与方的数据进行数据增强后得到的；
将所述全局压缩模型发送至所述多个参与方以进行N+1轮训练。

2.如权利要求1所述的多端模型压缩方法，其特征在于，所述采用公共数据集基于预设准确率对所述全局待压缩模型进行压缩，得到全局压缩模型包括：
基于剪枝算法利用公共数据集对所述全局压缩模型进行剪枝，得到所述全局压缩模型。

3.如权利要求1所述的多端模型压缩方法，其特征在于，所述服务方基于剪枝算法利用公共数据集对所述压缩模型进行剪枝操作，得到所述全局压缩模型包括：
利用所述公共数据集对所述全局待压缩模型的当前全局参数进行更新得到所述全局待压缩模型的更新梯度；
利用所述更新梯度确定所述全局待压缩模型的神经元的贡献度，所述贡献度用于表征神经元的激活程度；
保留满足预设条件的神经元作为所述全局压缩模型，所述预设条件包括预设贡献度阈值和/或神经元数量比例。

4.如权利要求3所述的多端模型压缩方法，其特征在于，所述利用所述公共数据集对所述全局待压缩模型的当前全局参数进行更新得到所述全局待压缩模型的更新梯度包括：
利用所述公共数据集对所述全局待压缩模型的进行向前传播和反向传播，得到所述更新梯度。

5.如权利要求3或4所述的多端模型压缩方法，其特征在于，利用所述全局更新参数确定所述全局待压缩模型的神经元的贡献度包括：
根据所述更新梯度确定神经元的权重值梯度；
基于所述权重值梯度计算神经元的贡献度。

6.如权利要求1所述的多端模型压缩方法，其特征在于，在所述采用公共数据集基于预设准确率对所述全局待压缩模型进行压缩和所述将所述全局压缩模型发送至所述多个参与方以进行N+1轮训练之间包括：
利用所述公共数据集对所述...

【专利技术属性】
技术研发人员：韦达，孟丹，李宏宇，李晓林，
申请(专利权)人：同盾控股有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人