模型融合方法、装置、设备及存储介质制造方法及图纸

技术编号：36546140 阅读：11 留言：0更新日期：2023-02-04 16:58

本公开实施例涉及一种模型融合方法、装置、设备及存储介质，通过获取多个待融合的模型和多个随机数组，分别以每个随机数组中的随机权重对多个待融合的模型进行加权融合处理，得到每个随机数组对应的融合模型，然后，基于预设的测试样本，确定各融合模型对应的准确率，将准确率最高的融合模型确定为目标融合模型，能够提高模型的性能，使得模型不受任务场景的限制，提高了模型的普适性，并且本公开实施例提供的模型融合方法不需要像聚合的方法那样将多个模型运行在同一机器上，因此降低了对机器计算资源的消耗。对机器计算资源的消耗。对机器计算资源的消耗。

全部详细技术资料下载

【技术实现步骤摘要】
模型融合方法、装置、设备及存储介质

[0001]本公开实施例涉及人工智能
，尤其涉及一种模型融合方法、装置、设备及存储介质。

技术介绍

[0002]相关技术可以对多个结构、类型和功能相同的模型进行融合，得到一个性能更强的模型。模型融合的方法主要有：聚合的方法和权重融合的方法。
[0003]其中，聚合的方法是通过将多个模型的输出进行融合来得到一个更好的预测结果。但是这种方法需要同时把多个模型放到同一个机器上运行，对机器计算资源的消耗较大。权重融合的方法是通过对模型的权重参数进行融合，从而得到一个更优的模型。但是权重融合的方法大多是将指数平滑的方式作为一种训练技巧加入到模型的训练过程中，这种方法仅能够给少数任务带来微弱的性能提升，应用局限性较大，且性能提升有限。

技术实现思路

[0004]为了解决上述技术问题或者至少部分地解决上述技术问题，本公开实施例提供了一种模型融合方法、装置、设备及存储介质。
[0005]本公开实施例的第一方面提供了一种模型融合方法，该方法包括：获取多个待融合的模型和多个随机数组，随机数组中包括各待融合的模型对应的随机权重；分别以每个随机数组中的随机权重对多个待融合的模型进行加权融合处理，得到每个随机数组对应的融合模型；基于预设的测试样本，确定各融合模型对应的准确率，将准确率最高的融合模型确定为目标融合模型。
[0006]本公开实施例的第二方面提供了一种模型处理装置，该装置包括：
[0007]获取模块，用于获取多个待融合的模型和多个随机数组，随机...

【技术保护点】

【技术特征摘要】
1.一种模型融合方法，其特征在于，包括：获取多个待融合的模型和多个随机数组，所述随机数组中包括各待融合的模型对应的随机权重；分别以每个随机数组中的随机权重对所述多个待融合的模型进行加权融合处理，得到每个随机数组对应的融合模型；基于预设的测试样本，确定各融合模型对应的准确率，将准确率最高的融合模型确定为目标融合模型。2.根据权利要求1所述的方法，其特征在于，所述获取多个待融合的模型，包括：获取多个参数不同的模型；基于预设的样本组对所述多个参数不同的模型进行训练，将训练得到的多个模型作为待融合的模型。3.根据权利要求2所述的方法，其特征在于，所述获取多个参数不同的模型，包括：获取多个超参数不同的模型。4.根据权利要求2或3所述的方法，其特征在于，所述获取多个参数不同的模型，包括：获取多个内置权重参数不同的模型。5.根据权利要求4所述的方法，其特征在于，所述获取多个内置权重参数不同的模型，包括：获取原始模型；对所述原始模型中的权重参数进行多次随机初始化处理，得到多个权重参数不同的模型。6.根据权利要求1所述的方法，其特征在于，所述分别以每个随机数组中的随机权重对所述多个待融合的模型进行加权融合，得到每个随机数组对应的融合模型，包括：针对每个随机数组，基于所述随机数组中的随机权重，对所述多个待融合的模型的参数进行加权求和处理，得到目标参数；将所述目标参数作为融合模型的模型参数，生成得到所述随机数组对应的融合模型。7.一种模型处理装置，其特征在于，包括：获取模块，用于获取多个待融合的模型和多个随机数组，所述随机数组中包括各待融合的模型对应的随机权重；融合模块，用于分别以每个随机数组中的随机权重对所述多个待融合的模...

【专利技术属性】
技术研发人员：曾海恩，
申请(专利权)人：北京字跳网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人