分类模型训练方法、使用方法、电子设备及存储介质技术

技术编号:33616644 阅读:20 留言:0更新日期:2022-06-02 00:31
本申请公开了一种分类模型训练方法、使用方法、电子设备及存储介质,其中,训练方法包括构建待训练的分类模型,分类模型包括特征提取网络、与特征提取网络连接的物体分类网络、物体框回归网络及锚框形状预测网络;获取样本图片集,其中,每个样本图片集对应一种物品类别,每个样本图片集中的每个样本图片中均包括该样本图片集所对应的物品类别下的物品,物品标识有物体边框;基于特征提取网络对样本图片集内的样本图片进行特征提取,以获取对应的特征向量;基于特征向量及物体边框分别构建锚框形状预测网络、物体分类网络、及物体框回归网络的损失函数;基于损失函数训练锚框形状预测网络、物体分类网络、及物体框回归网络,得到收敛的分类模型。的分类模型。的分类模型。

【技术实现步骤摘要】
分类模型训练方法、使用方法、电子设备及存储介质


[0001]本申请涉及机器人视觉
,尤其涉及一种分类模型训练方法、使用方法、电子设备及存储介质。

技术介绍

[0002]目标检测的任务是找出图像中所有感兴趣的目标物体,确定它们的位置和大小,是机器视觉领域的核心问题之一。由于各类物体有不同的外观,形状,姿态,加上成像时光照,遮挡等因素的干扰,目标检测一直是机器视觉领域最具有挑战性的问题之一。近年来,随着深度学习的发展,基于深度学习的目标检测框架已经成为目标检测的主流,在各行各业有着广泛的应用。
[0003]现有较为成熟的基于深度学习的目标检测框架多为基于锚框(anchor)的框架。然而,提前固定的锚框缺乏通用性,使得目标检测器对于不同的数据集失效,人工地对不同数据集设置锚框又费时费力,无法高效地将目标检测器应用在实际场景中。

技术实现思路

[0004]本申请的主要目的在于提供一种分类模型训练方法、目标检测方法、设备及存储介质,旨在减少分类模型训练使用时所需求的人工资源,并提高分类模型的精度和通用性。
[0005]第一方面,为实现上述目的,本申请提供一种分类模型训练方法,所述方法包括:
[0006]构建待训练的分类模型,所述分类模型包括特征提取网络、与所述特征提取网络连接的物体分类网络、物体框回归网络及锚框形状预测网络;
[0007]获取样本图片集,其中,每个样本图片集对应一种物品类别,每个样本图片集中的每个样本图片中均包括该样本图片集所对应的物品类别下的物品,且所述物品标识有物体边框;
[0008]基于所述特征提取网络对所述样本图片集内的样本图片进行特征提取,以获取对应的特征向量;
[0009]基于所述特征向量及所述物体边框分别构建所述锚框形状预测网络、所述物体分类网络、及所述物体框回归网络对应的损失函数;
[0010]基于所述损失函数训练所述锚框形状预测网络、所述物体分类网络、及所述物体框回归网络,得到收敛的所述分类模型。
[0011]第二方面,为实现上述目的,本申请还提供一种分类模型的使用方法,所述分类模型为前述训练方法进行训练得到的模型,所述方法包括:
[0012]获取待检测图片,所述待检测图片中包括对应的物品类别下的物品;
[0013]将所述待检测图片输入至所述分类模型,以获取所述物品的分类预测结果及与所述物品对应尺寸的锚框。
[0014]第三方面,为实现上述目的,本申请还提供一种电子设备,所述电子设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行计算机程序,所述计算机程序
被所述处理器执行时,实现前述的分类模型训练方法或分类模型的使用方法。
[0015]第四方面,为实现上述目的,本申请还提供一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现前述的分类模型训练方法或分类模型的使用方法。
[0016]本申请实施例提供了一种分类模型训练方法、使用方法、电子设备及存储介质,其中,所述分类模型训练方法包括构建待训练的分类模型,所述分类模型包括特征提取网络、与所述特征提取网络连接的物体分类网络、物体框回归网络及锚框形状预测网络;获取样本图片集,其中,每个样本图片集对应一种物品类别,每个样本图片集中的每个样本图片中均包括该样本图片集所对应的物品类别下的物品,且所述物品标识有物体边框;基于所述特征提取网络对所述样本图片集内的样本图片进行特征提取,以获取对应的特征向量;基于所述特征向量及所述物体边框分别构建所述锚框形状预测网络、所述物体分类网络、及所述物体框回归网络对应的损失函数;基于所述损失函数训练所述锚框形状预测网络、所述物体分类网络、及所述物体框回归网络,得到收敛的所述分类模型。通过本申请所提供的分类模型训练方法所训练获取的分类模型的目标检测框架更加灵活,可以对不同的数据集自适应生成最合适的锚框,同时提高了目标检测器的精度和通用性。
[0017]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
[0018]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0019]图1为本申请实施例提供的一种分类模型训练方法的步骤流程图;
[0020]图2为本申请实施例通过特征金字塔网络获取特征图及锚机制的示意图;
[0021]图3为分类模型的损失函数构建方法的步骤流程图;
[0022]图4为本申请实施例提供的一种分类模型使用方法的步骤流程图;
[0023]图5为本申请实施例提供的一种电子设备的示意框图。
具体实施方式
[0024]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0025]需要说明的是,在本申请中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本申请要求
的保护范围之内。
[0026]附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
[0027]目标检测的任务是找出图像中所有感兴趣的目标物体,确定它们的位置和大小,是机器视觉领域的核心问题之一。由于各类物体有不同的外观,形状,姿态,加上成像时光照,遮挡等因素的干扰,目标检测一直是机器视觉领域最具有挑战性的问题之一。近年来,随着深度学习的发展,基于深度学习的目标检测框架已经成为目标检测的主流,在各行各业有着广泛的应用。
[0028]现有较为成熟的基于深度学习的目标检测框架多为基于锚框(anchor)的框架。锚框作为标注的物体位置的初始猜测框,在基于深度学习的检测器中起着至关重要的作用。然而,当前的锚框是在目标检测器训练之前提前定义好的,在训练与后续使用中不再变动。由于不同的数据集的最优锚框变化很大,因此使用这种提前固定的锚框缺乏通用性,使得目标检测器对于不同的数据集失效,人工地对不同数据集设置锚框又费时费力,无法高效地将目标检测器应用在实际场景中。
[0029]因此,有必要提供一种分类模型训本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分类模型训练方法,其特征在于,所述方法包括:构建待训练的分类模型,所述分类模型包括特征提取网络、与所述特征提取网络连接的物体分类网络、物体框回归网络及锚框形状预测网络;获取样本图片集,其中,每个样本图片集对应一种物品类别,每个样本图片集中的每个样本图片中均包括该样本图片集所对应的物品类别下的物品,且所述物品标识有物体边框;基于所述特征提取网络对所述样本图片集内的样本图片进行特征提取,以获取对应的特征向量;基于所述特征向量及所述物体边框分别构建所述锚框形状预测网络、所述物体分类网络、及所述物体框回归网络对应的损失函数;基于所述损失函数训练所述锚框形状预测网络、所述物体分类网络、及所述物体框回归网络,得到收敛的所述分类模型。2.根据权利要求1所述的方法,其特征在于,所述特征向量包括多个层级特征图,每个层级所述特征图对应的图像参数不同,所述基于所述特征向量及所述物体边框分别构建所述锚框形状预测网络、所述物体分类网络、及所述物体框回归网络对应的损失函数,包括:获取所述物体边框与各个层级的所述特征图的匹配度;基于所述匹配度将所述物体边框分配给对应层级的所述特征图;基于所述特征图分别构建所述锚框形状预测网络、所述物体分类网络、及所述物体框回归网络对应的损失函数。3.根据权利要求2所述的方法,其特征在于,所述获取所述物体边框与各个层级的所述特征图的匹配度,包括:将所述物体边框分别分配到各个层级的所述特征图;基于各个层级所述特征图分别获取所述物体分类网络的输出正例分类预测值,及所述锚框形状预测网络输出的预测锚框形状;获取所述预测锚框形状与所述物体框的相似度比值;基于所述相似度比值及所述正例分类预测值确定各个层级的所述特征图的匹配度。4.根据权利要求2所述的方法,其特征在于,所述损失函数包括第一损失函数,基于所述特征图构建所述锚框形状预测网络的损失函数,包括:获取所述物体边框在所述特征图的第一坐标信息、锚框中心点在所述特征图的第二坐标信息,及所述物体边框与所述锚框的交并比;基于所述第一坐标信息、所述第二坐...

【专利技术属性】
技术研发人员:豆泽阳蒋阳庞磊赵丛
申请(专利权)人:共达地创新技术深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1