模型训练、图像分类方法、服务器及存储介质技术

技术编号:32629834 阅读:18 留言:0更新日期:2022-03-12 18:03
本申请实施例提供一种模型训练、图像分类方法、服务器及存储介质。在本实施例中,第一模型中的多个专家模型中,包括至少两种具有不同网络结构的专家模型,从而可利用不同的专家模型进行知识学习,有利于在样本数量有限时,对不同难度的样本进行识别。根据专家模型收敛后从样本图像上提取到的图像特征对融合模型进行训练,可使得融合模型根据专家模型学习到的知识,动态地学习如何合理利用多个专家模型各自学习到的知识,从而让不同的性能的专家模型对最终输出的分类结果做出不同的贡献,即使在样本图像的数量较少的情况下,也能够进行高效学习。学习。学习。

【技术实现步骤摘要】
模型训练、图像分类方法、服务器及存储介质


[0001]本申请涉及计算机视觉
,尤其涉及一种模型训练、图像分类方法、服务器及存储介质。

技术介绍

[0002]神经网络的发展不断推动了人工智能的进步,而神经网络的训练离不开海量的训练数据和预训练模型。在一些应用场景中,经常会面临缺乏充足的训练数据而无法训练出足够有效的神经网络模型的技术问题。因此,有待提出一种解决方案。

技术实现思路

[0003]本申请实施例的多个方面提供一种模型训练、图像分类方法、服务器及存储介质,用以在训练数据有限的情况下,提升神经网络模型的性能。
[0004]本申请实施例提供一种图像分类方法,包括:将待处理的图像输入第一模型;所述第一模型包括:多个专家模型以及与所述多个专家模型连接的融合模型;所述多个专家模型包括至少两种不同网络结构的专家模型;通过所述多个专家模型对所述样本图像进行特征提取,得到所述多个专家模型各自对应的图像特征;通过所述融合模型,根据所述多个专家模型各自的特征融合参数,对所述多个专家模型各自对应的图像特征进行融合处理;通过所述融合模型对融合得到的特征进行分类运算处理,得到第一分类结果。
[0005]本申请实施例还提供一种场景分类方法,包括:获取对目标场所进行拍摄得到的视频数据;将所述视频数据中的任一帧图像输入第一模型;所述第一模型包括:多个专家模型以及与所述多个专家模型连接的融合模型;所述多个专家模型包括至少两种不同网络结构的专家模型;通过所述多个专家模型对所述图像进行特征提取,得到所述多个专家模型各自对应的图像特征;通过所述融合模型,根据所述多个专家模型各自的特征融合参数,对所述多个专家模型各自对应的图像特征进行融合处理;通过所述融合模型对融合得到的特征进行分类运算处理,得到所述目标场所对应的场景类别。
[0006]本申请实施例还提供一种模型训练方法,待训练的第一模型包括:多个专家模型,以及与所述多个专家模型连接的融合模型;所述多个专家模型包括至少两种不同网络结构的专家模型;所述方法包括:获取所述多个专家模型在收敛后对样本图像进行特征提取得到的图像特征;所述样本图像上标注有标签真值;通过所述融合模型,根据所述多个专家模型各自的特征融合参数,对所述多个专家模型各自对应的图像特征进行融合,并对融合得到的特征进行分类运算处理,得到第一分类结果;以令所述第一分类结果与所述标签真值的差距收敛至第一指定范围为学习目标,调整所述多个专家模型各自的特征融合参数。
[0007]本申请实施例还提供一种图像分类方法,包括:响应客户端对第一接口的调用请求,获取接口参数包含的待处理的图像;将所述待处理的图像输入第一模型;所述第一模型包括:多个专家模型以及与所述多个专家模型连接的融合模型;所述多个专家模型包括至少两种不同网络结构的专家模型;通过所述多个专家模型对所述样本图像进行特征提取,
得到所述多个专家模型各自对应的图像特征;通过所述融合模型,根据所述多个专家模型各自的特征融合参数,对所述多个专家模型各自对应的图像特征进行融合处理,并对融合得到的特征进行分类运算处理,得到第一分类结果;将所述第一分类结果返回至所述客户端。
[0008]本申请实施例还提供一种服务器,包括:存储器、处理器以及通信组件;所述存储器,用于存储一条或多条计算机指令;所述处理器,用于执行一条或多条计算机指令,以用于执行本申请实施例提供的方法中的步骤。
[0009]本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,所述计算机程序被执行时能够实现本申请实施例提供方法中的步骤。
[0010]在本申请实施例中,第一模型中的多个专家模型中,包括至少两种具有不同网络结构的专家模型,从而可利用不同的专家模型进行知识学习,有利于在样本数量有限时,对不同难度的样本进行识别。根据专家模型收敛后从样本图像上提取到的图像特征对融合模型进行训练,可使得融合模型根据专家模型学习到的知识,动态地学习如何合理利用多个专家模型各自学习到的知识,从而让不同的性能的专家模型对最终输出的分类结果做出不同的贡献,极大提升了第一模型的整体性能。同时,这种训练方式可降低对样本图像的数量的依赖,在样本图像的数量较少的情况下,也能够进行高效学习,从而获取更优的模型性能。
附图说明
[0011]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0012]图1为本申请一示例性实施例提供的一种模型训练方法的流程示意图;
[0013]图2为本申请另一示例性实施例提供的一种模型训练方法的流程示意图;
[0014]图3为本申请一示例性实施例提供的一种混合专家模型的网络结构示意图;
[0015]图4为本申请一示例性实施例提供的一种图像分类方法的流程示意图;
[0016]图5为本申请另一示例性实施例提供的图像分类方法的流程示意图;
[0017]图6为本申请一示例性实施例提供的一种终端设备的结构示意图。
具体实施方式
[0018]为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0019]神经网络的发展不断推动了人工智能的进步,而神经网络的训练离不开海量的训练数据和预训练模型。在一些应用场景中,经常会面临缺乏充足的训练数据而无法训练出足够有效的神经网络模型的技术问题。
[0020]在一些模型训练方法中,可采用多专家混合模型进行知识学习。在进行分类预测时,一种方式中,将多个专家输出的预测结果进行平均后作为最终预测结果。另一种方式中,采用一种路由结构决定根据哪些专家模型输出的预测结果输出最终的预测结果。然而,
上述方式并未充分利用多专家混合模型的特点,未考虑不同的专家模型在性能上的优劣,导致输出的图像的分类结果的准确性是有限的。从而,无法在缺乏充足的训练数据的情况下,提升训练出的神经网络模型的性能。
[0021]针对上述技术问题,本申请的一些示例性实施例提供了一种解决方案,以下部分将结合附图进行详细说明。
[0022]图1为本申请一示例性实施例提供的一种模型训练方法的流程示意图。如图1所示,该方法包括:
[0023]步骤101、获取第一模型中的多个专家模型在收敛后对样本图像进行特征提取得到的图像特征;所述样本图像上标注有标签真值;所述多个专家模型包括至少两种不同网络结构的专家模型。
[0024]步骤102、通过所述第一模型中的融合模型,根据所述多个专家模型各自的特征融合参数,对所述多个专家模型各自对应的图像特征进行融合,并对融合得到的特征进行分类运算处理,得到第一分类结果。
[0025]步骤103、以令所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像分类方法,其特征在于,包括:将待处理的图像输入第一模型;所述第一模型包括:多个专家模型以及与所述多个专家模型连接的融合模型;所述多个专家模型包括至少两种不同网络结构的专家模型;通过所述多个专家模型对所述图像进行特征提取,得到所述多个专家模型各自对应的图像特征;通过所述融合模型,根据所述多个专家模型各自的特征融合参数,对所述多个专家模型各自对应的图像特征进行融合处理;通过所述融合模型对融合得到的特征进行分类运算处理,得到第一分类结果。2.根据权利要求1所述的方法,其特征在于,通过所述融合模型,根据所述多个专家模型各自的特征融合参数,对所述多个专家模型各自对应的图像特征进行融合处理之前,还包括:通过所述融合模型,根据所述多个专家模型在收敛后对样本图像进行特征提取得到的图像特征以及所述样本图像上标注的标签真值,动态地学习所述多个专家模型各自的特征融合参数。3.一种场景分类方法,其特征在于,包括:获取对目标场所进行拍摄得到的视频数据;将所述视频数据中的任一帧图像输入第一模型;所述第一模型包括:多个专家模型以及与所述多个专家模型连接的融合模型;所述多个专家模型包括至少两种不同网络结构的专家模型;通过所述多个专家模型对所述图像进行特征提取,得到所述多个专家模型各自对应的图像特征;通过所述融合模型,根据所述多个专家模型各自的特征融合参数,对所述多个专家模型各自对应的图像特征进行融合处理;通过所述融合模型对融合得到的特征进行分类运算处理,得到所述目标场所对应的场景类别。4.一种模型训练方法,其特征在于,待训练的第一模型包括:多个专家模型,以及与所述多个专家模型连接的融合模型;所述多个专家模型包括至少两种不同网络结构的专家模型;所述方法包括:获取所述多个专家模型在收敛后对样本图像进行特征提取得到的图像特征;所述样本图像上标注有标签真值;通过所述融合模型,根据所述多个专家模型各自的特征融合参数,对所述多个专家模型各自对应的图像特征进行融合,并对融合得到的特征进行分类运算处理,得到第一分类结果;以令所述第一分类结果与所述标签真值的差距收敛至第一指定范围为学习目标,调整所述多个专家模型各自的特征融合参数。5.根据权利要求4所述的方法,其特征在于,获取所述多个专家模型在收敛后对样本图像进行特征提取得到的图像特征之前,还包括:通过所述多个专家模型对所述样本图像进行特征提取,得到所述多个专家模型各自对应的图像特征;
通过所述多个专家模型各自对应的分类器,对所述多个专家模型各自对应的图像特征进行分类运算处理,得到所述多个专家模型各自的分类结果;以令所述多个专家模型各自的分类结果与所述标签真值的差距收敛至第二指定范围为学习目标,调整所述多个专家模型各自的参数。6.根据权利要求5所述的方法,其特征在于,所述多个专家模型中,任一专家模型包括多个特征计算模块;通过所述多个专家模型对所述样本图像进行特征提取,得到所述多个专家模型各自对应的图像特征,包括:针对所述多个专家模型中的任一专家模型,从所述专家模型中,随机选...

【专利技术属性】
技术研发人员:孙鹏飞
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1