一种多类别多目标检测及特征提取方法技术

技术编号：39678588 阅读：5 留言：0更新日期：2023-12-11 18:56

本申请公开了一种多类别多目标检测及特征提取方法

全部详细技术资料下载

【技术实现步骤摘要】
一种多类别多目标检测及特征提取方法、装置及相关设备

[0001]本申请涉及计算机视觉
，更具体地说，是涉及一种多类别多目标检测及特征提取方法
、
装置及相关设备
。

技术介绍

[0002]目前，基于嵌入式设备的多目标检测方法主要包括使用人为设计的特征进行检测学习的传统检测方法，以及基于深度学习的多目标检测方法
。
[0003]其中，前者由于采取的是先验设计的相关特征信息，因此无法灵活地满足不同类别的位置定位，无法对多个类别多个目标进行准确的检测定位
。
[0004]后者一般使用深度学习检测器进行前期的多类别检测，然后使用独立的特征提取网络对检测器中定位到的目标进行特征提取
。
然而此类方法通常仅支持单一类别的多目标检测，且随着检测到的目标的数目增加，每一帧画面对应目标的特征提取耗时将相应的线性增加，存在较大的时间开销，难以满足嵌入式设备的实时性要求
。

技术实现思路

[0005]有鉴于此，本申请提供了一种多类别多目标检测及特征提取方法
、
装置及相关设备，以实现多类别多目标的检测
。
[0006]为实现上述目的，本申请第一方面提供了一种多类别多目标检测及特征提取方法，包括：
[0007]将待检测的图像的尺寸转换为预设的图像尺寸，得到目标图像；
[0008]采用训练后的目标检测模型对所述目标图像进行推理，得到所述目标图像中各目标对象的位置信息以及表观特征，所述表观特征用于...

【技术保护点】

【技术特征摘要】
1.
一种多类别多目标检测及特征提取方法，其特征在于，包括：将待检测的图像的尺寸转换为预设的图像尺寸，得到目标图像；采用训练后的目标检测模型对所述目标图像进行推理，得到所述目标图像中各目标对象的位置信息以及表观特征，所述表观特征用于表征所述目标对象的外观属性；其中，所述目标检测模型被配置为，具备对图像中各预设类别下的各目标对象以无需锚点
Anchor
‑
Free
的模式进行检测的能力，以及具备对于检测到的目标对象的表观特征进行提取的能力
。2.
根据权利要求1所述的方法，其特征在于，所述目标检测模型包括依次级联的输入层
、
若干特征金字塔网络及过渡层
、
若干全连接层和若干输出层；所述输入层的输入图像的尺寸不大于
384
像素
×
224
像素；所述特征金字塔网络及过渡层用于学习并汇聚所述目标图像的分布式特征表示；所述全连接层用于将学习到的分布式特征表示映射到样本标记空间；所述输出层包括具有预设通道数的目标中心点输出
、
具有2通道的中心点偏移输出，具有2通道的相对于中心点的宽高偏移输出，以及具有
64
通道的表观特征输出，所述预设通道数等同于所述预设类别的数目
。3.
根据权利要求2所述的方法，其特征在于，所述预设通道数以及所述预设类别的数目为7，所述预设类别包括行人
、
自行车
、
摩托车
、
轿车
、
卡车
、
巴士和三轮车
。4.
根据权利要求1所述的方法，其特征在于，所述目标检测模型的训练过程，包括：将用于训练的图像输入至所述目标检测模型，得到所述图像中各目标对象的位置信息以及表观特征；针对每一目标对象的位置信息及表观特征，按照设定的目标函数计算所述位置信息及所述表观特征的损失值，并以损失值最小化为目标，更新所述目标检测模型的参数；其中，所述用于训练的图像包括至少多个预设类别下的多个目标对象的图像
。5.
根据权利要求4所述的方法，其特征在于，所述位置信息包括目标中心点，所述按照设定的目标函数计算所述位置信息的损...

【专利技术属性】
技术研发人员：颜城城，王忠，
申请(专利权)人：熵基科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人