模型融合方法、装置、设备及存储介质制造方法及图纸

技术编号:36546140 阅读:11 留言:0更新日期:2023-02-04 16:58
本公开实施例涉及一种模型融合方法、装置、设备及存储介质,通过获取多个待融合的模型和多个随机数组,分别以每个随机数组中的随机权重对多个待融合的模型进行加权融合处理,得到每个随机数组对应的融合模型,然后,基于预设的测试样本,确定各融合模型对应的准确率,将准确率最高的融合模型确定为目标融合模型,能够提高模型的性能,使得模型不受任务场景的限制,提高了模型的普适性,并且本公开实施例提供的模型融合方法不需要像聚合的方法那样将多个模型运行在同一机器上,因此降低了对机器计算资源的消耗。对机器计算资源的消耗。对机器计算资源的消耗。

【技术实现步骤摘要】
模型融合方法、装置、设备及存储介质


[0001]本公开实施例涉及人工智能
,尤其涉及一种模型融合方法、装置、设备及存储介质。

技术介绍

[0002]相关技术可以对多个结构、类型和功能相同的模型进行融合,得到一个性能更强的模型。模型融合的方法主要有:聚合的方法和权重融合的方法。
[0003]其中,聚合的方法是通过将多个模型的输出进行融合来得到一个更好的预测结果。但是这种方法需要同时把多个模型放到同一个机器上运行,对机器计算资源的消耗较大。权重融合的方法是通过对模型的权重参数进行融合,从而得到一个更优的模型。但是权重融合的方法大多是将指数平滑的方式作为一种训练技巧加入到模型的训练过程中,这种方法仅能够给少数任务带来微弱的性能提升,应用局限性较大,且性能提升有限。

技术实现思路

[0004]为了解决上述技术问题或者至少部分地解决上述技术问题,本公开实施例提供了一种模型融合方法、装置、设备及存储介质。
[0005]本公开实施例的第一方面提供了一种模型融合方法,该方法包括:获取多个待融合的模型和多个随机数组,随机数组中包括各待融合的模型对应的随机权重;分别以每个随机数组中的随机权重对多个待融合的模型进行加权融合处理,得到每个随机数组对应的融合模型;基于预设的测试样本,确定各融合模型对应的准确率,将准确率最高的融合模型确定为目标融合模型。
[0006]本公开实施例的第二方面提供了一种模型处理装置,该装置包括:
[0007]获取模块,用于获取多个待融合的模型和多个随机数组,随机数组中包括各待融合的模型对应的随机权重;
[0008]融合模块,用于分别以每个随机数组中的随机权重对多个待融合的模型进行加权融合处理,得到每个随机数组对应的融合模型;
[0009]确定模块,用于基于预设的测试样本,确定各融合模型对应的准确率,将准确率最高的融合模型确定为目标融合模型。
[0010]本公开实施例的第三方面提供了一种计算机设备,该计算机设备包括存储器和处理器,其中,存储器中存储有计算机程序,当该计算机程序被处理器执行时,可以实现上述第一方面的方法。
[0011]本公开实施例的第四方面提供了一种计算机可读存储介质,该存储介质中存储有计算机程序,当该计算机程序被处理器执行时,可以实现上述第一方面的方法。
[0012]本公开实施例提供的技术方案与现有技术相比具有如下优点:
[0013]本公开实施例,通过获取多个待融合的模型和多个随机数组,分别以每个随机数组中的随机权重对多个待融合的模型进行加权融合处理,得到每个随机数组对应的融合模
型,然后,基于预设的测试样本,确定各融合模型对应的准确率,将准确率最高的融合模型确定为目标融合模型,能够提高模型的性能,使得模型不受任务场景的限制,提高了模型的普适性,并且本公开实施例提供的模型融合方法不需要像现有技术聚合的方法那样将多个模型运行在同一机器上,因此降低了对机器计算资源的消耗。
附图说明
[0014]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
[0015]为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0016]图1是本公开实施例提供的一种模型融合方法的流程图;
[0017]图2是本公开实施例提供的一种获取待融合模型和随机数组的方法的示意图;
[0018]图3是本公开实施例提供的另一种获取待融合模型和随机数组的方法的示意图;
[0019]图4是本公开实施例提供的一种模型融合方法的示意图;
[0020]图5是本公开实施例提供的又一种模型融合方法的流程图;
[0021]图6是本公开实施例提供的一种模型处理装置的结构示意图;
[0022]图7是本公开实施例提供的一种计算机设备的结构示意图。
具体实施方式
[0023]为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
[0024]在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
[0025]图1是本公开实施例提供的一种模型融合方法的流程图,该方法可以由一种计算机设备来执行。该计算机设备可以理解为任意具有运算和处理能力的设备。如图1所示,本公开实施例提供的方法包括如下步骤:
[0026]步骤101、获取多个待融合的模型和多个随机数组,随机数组中包括各待融合的模型对应的随机权重。
[0027]本公开实施例中所称的多个待融合的模型是指多个结构、类型、功能相同的模型。
[0028]随机数组是指由多个随机数构成的数组,随机数组中的随机数的个数大于或等于待融合的模型的数量。在本公开实施例中,一个待融合的模型与随机数组中的一个随机数对应。待融合的模型对应的随机数称为该模型对应的随机权重。本公开实施例的随机数组有多个,也就是说每个待融合的模型在每个随机数组中都有一个对应的随机权重。
[0029]在本公开实施例中,待融合的模型和随机数据的获取方式可以有多种。比如,图2是本公开实施例提供的一种获取待融合模型和随机数组的方法的示意图。如图2所示,在本公开实施例的一种实施方式中,可以从网络服务器、数据库、可读存储介质等来源处获取多
个待融合的模型和多个随机数组。再比如,图3是本公开实施例提供的另一种获取待融合模型和随机数组的方法的示意图。如图3所示,在本公开实施例的另一种实施方式中,还可以先从预设的数据来源中获取n个待融合的模型,n为正整数,然后再根据获取到的待融合的模型的个数生成包含n个随机权重(即图3中的W1到Wn)的随机数组。需要说明的是,在图3所示的场景中,可以在基于一组随机数组处理得到融合模型之后,再生成下一组随机数组,并基于下一组随机数组生成相应的模型,如此循环直到获得预设数量的随机数组和融合模型为止。或者在又一种方式中,还可以在得到多个待融合的模型之后,就生成多个随机数组,然后再分别基于每个随机数组对多个待融合的模型进行融合。
[0030]当然图2和图3仅是两种示例性的方法而不是对待融合的模型和随机数组的获取方法的唯一限定,实际上,获取待融合的模型和随机数组的方法可以根据需要进行设定,而不必局限于某一种特定的方法。
[0031]步骤102、分别以每个随机数组中的随机权重对所述多个待融合的模型进行加权融合处理,得到每个随机数组对应的融合模型。
[0032]示例的,图4是本公开实施例提供的一种模型融合方法的示意图,在图4中,模型1和模型2是两个结构、类型、功能相同的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型融合方法,其特征在于,包括:获取多个待融合的模型和多个随机数组,所述随机数组中包括各待融合的模型对应的随机权重;分别以每个随机数组中的随机权重对所述多个待融合的模型进行加权融合处理,得到每个随机数组对应的融合模型;基于预设的测试样本,确定各融合模型对应的准确率,将准确率最高的融合模型确定为目标融合模型。2.根据权利要求1所述的方法,其特征在于,所述获取多个待融合的模型,包括:获取多个参数不同的模型;基于预设的样本组对所述多个参数不同的模型进行训练,将训练得到的多个模型作为待融合的模型。3.根据权利要求2所述的方法,其特征在于,所述获取多个参数不同的模型,包括:获取多个超参数不同的模型。4.根据权利要求2或3所述的方法,其特征在于,所述获取多个参数不同的模型,包括:获取多个内置权重参数不同的模型。5.根据权利要求4所述的方法,其特征在于,所述获取多个内置权重参数不同的模型,包括:获取原始模型;对所述原始模型中的权重参数进行多次随机初始化处理,得到多个权重参数不同的模型。6.根据权利要求1所述的方法,其特征在于,所述分别以每个随机数组中的随机权重对所述多个待融合的模型进行加权融合,得到每个随机数组对应的融合模型,包括:针对每个随机数组,基于所述随机数组中的随机权重,对所述多个待融合的模型的参数进行加权求和处理,得到目标参数;将所述目标参数作为融合模型的模型参数,生成得到所述随机数组对应的融合模型。7.一种模型处理装置,其特征在于,包括:获取模块,用于获取多个待融合的模型和多个随机数组,所述随机数组中包括各待融合的模型对应的随机权重;融合模块,用于分别以每个随机数组中的随机权重对所述多个待融合的模...

【专利技术属性】
技术研发人员:曾海恩
申请(专利权)人:北京字跳网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1