场景分类模型的训练方法、电子设备及存储介质技术

技术编号:38862386 阅读:18 留言:0更新日期:2023-09-17 10:04
本申请实施例提供了一种场景分类模型的训练方法、电子设备及存储介质,该方法包括:通过第一分类模型对样本图像进行多类别的识别处理,得到第一预测结果,通过第二分类模型对样本图像进行多类别的识别处理,得到第二预测结果,第一分类模型的网络参数量小于第二分类模型的网络参数量;确定第一分类模型的分类损失函数值,并确定第二分类模型的分类损失函数值;根据第一预测结果和第二预测结果,确定互监督损失函数值;根据第一分类模型的分类损失函数值和互监督损失函数值,对第一分类模型的网络参数进行更新,根据第二分类模型的分类损失函数值,对第二分类模型的网络参数进行更新。本申请实施例可以提高模型的分类识别准确性。性。性。

【技术实现步骤摘要】
场景分类模型的训练方法、电子设备及存储介质


[0001]本申请实施例涉及人工智能
,特别是涉及一种场景分类模型的训练方法、电子设备及存储介质。

技术介绍

[0002]在智能手机等电子设备与人们生活紧密相连的今天,电子设备的软硬件、算法已经逐渐趋于同质化,因此越来越多的电子设备通过使用AI(Artificial Intelligence,人工智能)算法来实现差异化的亮点功能,其中也包括了场景识别算法。当用户通过手机等电子设备拍摄某一具体场景时,由于缺乏专业知识往往不会针对性调整相机参数,这时电子设备通过对预览流图片进行AI场景识别进而自动对参数调整,当拍摄完成时可以自动修图并完成智能相册分类,这一连串的操作离不开精准的场景识别算法。
[0003]现有技术中,场景识别算法基本都是采用基于深度学习的多标签分类技术,但是由于多标签分类任务的特殊性,极大的增大了训练的难度。多标签分类任务中,类别数目较多,从而数据标注员在进行数据标注时,往往存在某张图片漏标某个类别的情况,这种“脏数据”会对训练带来不可逆转的影响,导致训练完成的模型的识别准确性低。

技术实现思路

[0004]鉴于上述问题,提出了本申请实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种场景分类模型的训练方法、电子设备及存储介质。
[0005]依据本申请实施例的第一方面,提供了一种场景分类模型的训练方法,包括:
[0006]通过第一分类模型对目标样本图像集合中的样本图像进行多类别的识别处理,得到第一预测结果,并通过第二分类模型对所述样本图像进行多类别的识别处理,得到第二预测结果,其中,所述第一分类模型的网络参数量小于所述第二分类模型的网络参数量;
[0007]根据所述样本图像的分类标签和所述第一预测结果,确定所述第一分类模型的分类损失函数值,并根据所述分类标签和所述第二预测结果,确定所述第二分类模型的分类损失函数值;
[0008]根据所述第一预测结果和所述第二预测结果,确定互监督损失函数值;
[0009]根据所述第一分类模型的分类损失函数值和所述互监督损失函数值,对所述第一分类模型的网络参数进行更新,并根据所述第二分类模型的分类损失函数值,对所述第二分类模型的网络参数进行更新;
[0010]将训练完成的第一分类模型作为待部署的场景分类模型。
[0011]依据本申请实施例的第二方面,提供了一种电子设备,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如第一方面中所述的场景分类模型的训练方法。
[0012]依据本申请实施例的第三方面,提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的
场景分类模型的训练方法。
[0013]依据本申请实施例的第四方面,提供了一种计算机程序产品,包括计算机程序或计算机指令,所述计算机程序或计算机指令被处理器执行时实现如第一方面所述的场景分类模型的训练方法。
[0014]本申请实施例提供的场景分类模型的训练方法、电子设备及存储介质,通过第一分类模型对目标样本图像集合中的样本图像进行多类别的识别处理,得到第一预测结果,并通过第二分类模型对样本图像进行多类别的识别处理,得到第二预测结果,根据样本图像的分类标签和第一预测结果确定第一分类模型的分类损失函数值,并根据分类标签和第二预测结果,确定第二分类模型的分类损失函数值,根据第一预测结果和第二预测结果,确定互监督损失函数值,根据第一分类模型的分类损失函数值和互监督损失函数值,对第一分类模型的网络参数进行更新,并根据第二分类模型的分类损失函数值,对第二分类模型的网络参数进行更新,将训练完成的第一分类模型作为待部署的场景分类模型,由于第二分类模型的网络参数量大于第一分类模型的网络参数量,同时对第一分类模型和第二分类模型进行训练,训练的过程中可以由样本图像的分类标签和第二分类模型的第二预测结果来共同指导对第一分类模型的训练,采用这种双模型联动训练的方法可以减弱遗漏分类标签给模型训练带来的影响,从而可以提高第一分类模型的分类识别准确性。
[0015]上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
[0016]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。
[0017]图1是本申请实施例提供的一种场景分类模型的训练方法的步骤流程图;
[0018]图2是本申请实施例提供的另一种场景分类模型的训练方法的步骤流程图;
[0019]图3是本申请实施例提供的一种场景分类模型的训练方法的流程图;
[0020]图4是本申请实施例提供的一种场景分类模型的训练装置的结构框图。
具体实施方式
[0021]下面将参照附图更详细地描述本申请的示例性实施例。虽然附图中显示了本申请的示例性实施例,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本申请,并且能够将本申请的范围完整的传达给本领域的技术人员。
[0022]近年来,基于人工智能的计算机视觉、深度学习、机器学习、图像处理、图像识别等技术研究取得了重要进展。人工智能(Artificial Intelligence,AI)是研究、开发用于模拟、延伸人的智能的理论、方法、技术及应用系统的新兴科学技术。人工智能学科是一门综合性学科,涉及芯片、大数据、云计算、物联网、分布式存储、深度学习、机器学习、神经网络等诸多技术种类。计算机视觉作为人工智能的一个重要分支,具体是让机器识别世界,计算
机视觉技术通常包括人脸识别、活体检测、指纹识别与防伪验证、生物特征识别、人脸检测、行人检测、目标检测、行人识别、图像处理、图像识别、图像语义理解、图像检索、文字识别、视频处理、视频内容识别、三维重建、虚拟现实、增强现实、同步定位与地图构建(SLAM)、计算摄影、机器人导航与定位等技术。随着人工智能技术的研究和进步,该项技术在众多领域展开了应用,例如安全防控、城市管理、交通管理、楼宇管理、园区管理、人脸通行、人脸考勤、物流管理、仓储管理、机器人、智能营销、计算摄影、手机影像、云服务、智能家居、穿戴设备、无人驾驶、自动驾驶、智能医疗、人脸支付、人脸解锁、指纹解锁、人证核验、智慧屏、智能电视、摄像机、移动互联网、网络直播、美颜、美妆、医疗美容、智能测温等领域。本申请实施例也是涉及计算机视觉技术,具体是一种场景分类模型的训练方法,用于对多标签场景的分类训练,具体方案如下:
[0023]图1是本申请实施例提供的一种场景分类模型的训练方法的步骤流程图,如图1所示,该方法可以包本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种场景分类模型的训练方法,其特征在于,包括:通过第一分类模型对目标样本图像集合中的样本图像进行多类别的识别处理,得到第一预测结果,并通过第二分类模型对所述样本图像进行多类别的识别处理,得到第二预测结果,其中,所述第一分类模型的网络参数量小于所述第二分类模型的网络参数量;根据所述样本图像的分类标签和所述第一预测结果,确定所述第一分类模型的分类损失函数值,并根据所述分类标签和所述第二预测结果,确定所述第二分类模型的分类损失函数值;根据所述第一预测结果和所述第二预测结果,确定互监督损失函数值;根据所述第一分类模型的分类损失函数值和所述互监督损失函数值,对所述第一分类模型的网络参数进行更新,并根据所述第二分类模型的分类损失函数值,对所述第二分类模型的网络参数进行更新;将训练完成的第一分类模型作为待部署的场景分类模型。2.根据权利要求1所述的方法,其特征在于,所述根据所述样本图像的分类标签和所述第一预测结果,确定所述第一分类模型的分类损失函数值,并根据所述分类标签和所述第二预测结果,确定所述第二分类模型的分类损失函数值,包括:根据所述样本图像的分类标签,确定每个类别在当前批次中的正样本数量和负样本数量,其中,所述正样本数量是分类标签包括所述类别的样本图像的数量,所述负样本数量是分类标签不包括所述类别的样本图像的数量;针对每个所述类别,根据所述正样本数量,确定结果预测为所述类别的权重,根据所述负样本数量确定结果预测为非所述类别的权重;根据结果预测为所述类别的权重和结果预测为非所述类别的权重,对所述分类标签和所述第一预测结果的交叉熵进行加权求和,得到所述第一分类模型的分类损失函数值;根据结果预测为所述类别的权重和结果预测为非所述类别的权重,对所述分类标签和所述第二预测结果的交叉熵进行加权求和,得到所述第二分类模型的分类损失函数值。3.根据权利要求2所述的方法,其特征在于,所述根据结果预测为所述类别的权重和结果预测为非所述类别的权重,对所述分类标签和所述第一预测结果的交叉熵进行加权求和,得到所述第一分类模型的分类损失函数值,包括:在所述第一预测结果中对应所述类别的第一置信度大于置信度阈值时,根据结果预测为所述类别的权重和结果预测为非所述类别的权重,对所述分类标签和所述第一预测结果的交叉熵进行加权求和,得到所述第一分类模型的分类损失函数值;所述根据结果预测为所述类别的权重和结果预测为非所述类别的权重,对所述分类标签和所述第二预测结果的交叉熵进行加权求...

【专利技术属性】
技术研发人员:陈宇浩
申请(专利权)人:南京旷云科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1