分类模型训练方法、使用方法、电子设备及存储介质技术

技术编号：33616644 阅读：20 留言：0更新日期：2022-06-02 00:31

本申请公开了一种分类模型训练方法、使用方法、电子设备及存储介质，其中，训练方法包括构建待训练的分类模型，分类模型包括特征提取网络、与特征提取网络连接的物体分类网络、物体框回归网络及锚框形状预测网络；获取样本图片集，其中，每个样本图片集对应一种物品类别，每个样本图片集中的每个样本图片中均包括该样本图片集所对应的物品类别下的物品，物品标识有物体边框；基于特征提取网络对样本图片集内的样本图片进行特征提取，以获取对应的特征向量；基于特征向量及物体边框分别构建锚框形状预测网络、物体分类网络、及物体框回归网络的损失函数；基于损失函数训练锚框形状预测网络、物体分类网络、及物体框回归网络，得到收敛的分类模型。的分类模型。的分类模型。

全部详细技术资料下载

【技术实现步骤摘要】
分类模型训练方法、使用方法、电子设备及存储介质

[0001]本申请涉及机器人视觉
，尤其涉及一种分类模型训练方法、使用方法、电子设备及存储介质。

技术介绍

[0002]目标检测的任务是找出图像中所有感兴趣的目标物体，确定它们的位置和大小，是机器视觉领域的核心问题之一。由于各类物体有不同的外观，形状，姿态，加上成像时光照，遮挡等因素的干扰，目标检测一直是机器视觉领域最具有挑战性的问题之一。近年来，随着深度学习的发展，基于深度学习的目标检测框架已经成为目标检测的主流，在各行各业有着广泛的应用。
[0003]现有较为成熟的基于深度学习的目标检测框架多为基于锚框(anchor)的框架。然而，提前固定的锚框缺乏通用性，使得目标检测器对于不同的数据集失效，人工地对不同数据集设置锚框又费时费力，无法高效地将目标检测器应用在实际场景中。

技术实现思路

[0004]本申请的主要目的在于提供一种分类模型训练方法、目标检测方法、设备及存储介质，旨在减少分类模型训练使用时所需求的人工资源，并提高分类模型的精度和通用性。
[0005]第一方面，为实现上述目的，本申请提供一种分类模型训练方法，所述方法包括：
[0006]构建待训练的分类模型，所述分类模型包括特征提取网络、与所述特征提取网络连接的物体分类网络、物体框回归网络及锚框形状预测网络；
[0007]获取样本图片集，其中，每个样本图片集对应一种物品类别，每个样本图片集中的每个样本图片中均包括该样本图片集所对应的物品类别下的物品，且所述物...

【技术保护点】

【技术特征摘要】
1.一种分类模型训练方法，其特征在于，所述方法包括：构建待训练的分类模型，所述分类模型包括特征提取网络、与所述特征提取网络连接的物体分类网络、物体框回归网络及锚框形状预测网络；获取样本图片集，其中，每个样本图片集对应一种物品类别，每个样本图片集中的每个样本图片中均包括该样本图片集所对应的物品类别下的物品，且所述物品标识有物体边框；基于所述特征提取网络对所述样本图片集内的样本图片进行特征提取，以获取对应的特征向量；基于所述特征向量及所述物体边框分别构建所述锚框形状预测网络、所述物体分类网络、及所述物体框回归网络对应的损失函数；基于所述损失函数训练所述锚框形状预测网络、所述物体分类网络、及所述物体框回归网络，得到收敛的所述分类模型。2.根据权利要求1所述的方法，其特征在于，所述特征向量包括多个层级特征图，每个层级所述特征图对应的图像参数不同，所述基于所述特征向量及所述物体边框分别构建所述锚框形状预测网络、所述物体分类网络、及所述物体框回归网络对应的损失函数，包括：获取所述物体边框与各个层级的所述特征图的匹配度；基于所述匹配度将所述物体边框分配给对应层级的所述特征图；基于所述特征图分别构建所述锚框形状预测网络、所述物体分类网络、及所述物体框回归网络对应的损失函数。3.根据权利要求2所述的方法，其特征在于，所述获取所述物体边框与各个层级的所述特征图的匹配度，包括：将所述物体边框分别分配到各个层级的所述特征图；基于各个层级所述特征图分别获取所述物体分类网络的输出正例分类预测值，及所述锚框形状预测网络输出的预测锚框形状；获取所述预测锚框形状与所述物体框的相似度比值；基于所述相似度比值及所述正例分类预测值确定各个层级的所述特征图的匹配度。4.根据权利要求2所述的方法，其特征在于，所述损失函数包括第一损失函数，基于所述特征图构建所述锚框形状预测网络的损失函数，包括：获取所述物体边框在所述特征图的第一坐标信息、锚框中心点在所述特征图的第二坐标信息，及所述物体边框与所述锚框的交并比；基于所述第一坐标信息、所述第二坐...

【专利技术属性】
技术研发人员：豆泽阳，蒋阳，庞磊，赵丛，
申请(专利权)人：共达地创新技术深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人