一种多类别多目标检测及特征提取方法技术

技术编号:39678588 阅读:5 留言:0更新日期:2023-12-11 18:56
本申请公开了一种多类别多目标检测及特征提取方法

【技术实现步骤摘要】
一种多类别多目标检测及特征提取方法、装置及相关设备


[0001]本申请涉及计算机视觉
,更具体地说,是涉及一种多类别多目标检测及特征提取方法

装置及相关设备


技术介绍

[0002]目前,基于嵌入式设备的多目标检测方法主要包括使用人为设计的特征进行检测学习的传统检测方法,以及基于深度学习的多目标检测方法

[0003]其中,前者由于采取的是先验设计的相关特征信息,因此无法灵活地满足不同类别的位置定位,无法对多个类别多个目标进行准确的检测定位

[0004]后者一般使用深度学习检测器进行前期的多类别检测,然后使用独立的特征提取网络对检测器中定位到的目标进行特征提取

然而此类方法通常仅支持单一类别的多目标检测,且随着检测到的目标的数目增加,每一帧画面对应目标的特征提取耗时将相应的线性增加,存在较大的时间开销,难以满足嵌入式设备的实时性要求


技术实现思路

[0005]有鉴于此,本申请提供了一种多类别多目标检测及特征提取方法

装置及相关设备,以实现多类别多目标的检测

[0006]为实现上述目的,本申请第一方面提供了一种多类别多目标检测及特征提取方法,包括:
[0007]将待检测的图像的尺寸转换为预设的图像尺寸,得到目标图像;
[0008]采用训练后的目标检测模型对所述目标图像进行推理,得到所述目标图像中各目标对象的位置信息以及表观特征,所述表观特征用于表征所述目标对象的外观属性;
[0009]其中,所述目标检测模型被配置为,具备对图像中各预设类别下的各目标对象以无需锚点
Anchor

Free
的模式进行检测的能力,以及具备对于检测到的目标对象的表观特征进行提取的能力

[0010]优选地,所述目标检测模型包括依次级联的输入层

若干特征金字塔网络及过渡层

若干全连接层和若干输出层;
[0011]所述输入层的输入图像的尺寸不大于
384
像素
×
224
像素;
[0012]所述特征金字塔网络及过渡层用于学习并汇聚所述目标图像的分布式特征表示;
[0013]所述全连接层用于将学习到的分布式特征表示映射到样本标记空间;
[0014]所述输出层包括具有预设通道数的目标中心点输出

具有2通道的中心点偏移输出,具有2通道的相对于中心点的宽高偏移输出,以及具有
64
通道的表观特征输出,所述预设通道数等同于所述预设类别的数目

[0015]优选地,所述预设通道数以及所述预设类别的数目为7,所述预设类别包括行人

自行车

摩托车

轿车

卡车

巴士和三轮车

[0016]优选地,所述目标检测模型的训练过程,包括:
[0017]将用于训练的图像输入至所述目标检测模型,得到所述图像中各目标对象的位置信息以及表观特征;
[0018]针对每一目标对象的位置信息及表观特征,按照设定的目标函数计算所述位置信息及所述表观特征的损失值,并以损失值最小化为目标,更新所述目标检测模型的参数;
[0019]其中,所述用于训练的图像包括至少多个预设类别下的多个目标对象的图像

[0020]优选地,所述位置信息包括目标中心点,所述按照设定的目标函数计算所述位置信息的损失值的过程,包括:
[0021]采用以下函数计算所述目标中心点的损失值:
[0022][0023]其中,
Y
xyc
为所述目标的边界框通过高斯模糊核函数生成的正样本的权重值,为所述目标预测模型对于所述目标中心点的预测值,
α

β
为预设的参数

[0024]在这里,由于基于
AnchorFree
在大目标检测上的天然不鲁棒性,加入正样本权重
Y
xyc
,将提高训练约束过程中的正样本中大目标的权重,帮助网络在推理过程中对大目标具有更好的鲁棒性

[0025]优选地,所述位置信息还包括中心点偏移以及相对于中心点的宽高偏移,所述按照设定的目标函数计算所述位置信息的损失值的过程,还包括:
[0026]采用以下函数计算所述中心点偏移以及所述相对于中心点的宽高偏移的损失值:
[0027][0028]其中,
y
i
为所述中心点偏移或所述相对于中心点的宽高偏移的标签值,为所述目标预测模型对于所述中心点偏移或所述相对于中心点的宽高偏移的预测值

[0029]优选地,所述按照设定的目标函数计算所述表观特征的损失值的过程,包括:
[0030]采用以下函数计算所述表观特征的损失值:
[0031][0032]其中,
L
cls
为预设的交叉熵函数,为所述表观特征的标签值,
p
i
为所述目标预测模型对于所述表观特征的预测值

[0033]本申请第二方面提供了一种多类别多目标检测及特征提取装置,包括:
[0034]转换单元,用于将待检测的图像的尺寸转换为预设的图像尺寸,得到目标图像;
[0035]推理单元,用于采用训练后的目标检测模型对所述目标图像进行推理,得到所述目标图像中各目标对象的位置信息以及表观特征,所述表观特征用于表征所述目标对象的外观属性;
[0036]其中,所述目标检测模型被配置为,具备对图像中各预设类别下的各目标对象基于
Anchor

Free
的模式进行检测,同时对于检测到的目标对象的表观特征进行提取的能力

[0037]本申请第三方面提供了一种多类别多目标检测及特征提取设备,包括:存储器和处理器;
[0038]所述存储器,用于存储程序;
[0039]所述处理器,用于执行所述程序,实现上述的多类别多目标检测及特征提取方法的各个步骤

[0040]本申请第四方面提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上述的多类别多目标检测及特征提取方法的各个步骤

[0041]经由上述的技术方案可知,本申请首先配置好一目标检测模型,其中,所述目标检测模型被配置为,具备对图像中各预设类别下的各目标对象基于
Anchor

Free
的模式进行检测,同时对于检测到的目标对象的表观特征进行提取的能力

由于所述目标检测模型的检测与特征提取同时进行,无需在检测出目标对象后再进行目标身份重识别,能够满足嵌入式设备本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种多类别多目标检测及特征提取方法,其特征在于,包括:将待检测的图像的尺寸转换为预设的图像尺寸,得到目标图像;采用训练后的目标检测模型对所述目标图像进行推理,得到所述目标图像中各目标对象的位置信息以及表观特征,所述表观特征用于表征所述目标对象的外观属性;其中,所述目标检测模型被配置为,具备对图像中各预设类别下的各目标对象以无需锚点
Anchor

Free
的模式进行检测的能力,以及具备对于检测到的目标对象的表观特征进行提取的能力
。2.
根据权利要求1所述的方法,其特征在于,所述目标检测模型包括依次级联的输入层

若干特征金字塔网络及过渡层

若干全连接层和若干输出层;所述输入层的输入图像的尺寸不大于
384
像素
×
224
像素;所述特征金字塔网络及过渡层用于学习并汇聚所述目标图像的分布式特征表示;所述全连接层用于将学习到的分布式特征表示映射到样本标记空间;所述输出层包括具有预设通道数的目标中心点输出

具有2通道的中心点偏移输出,具有2通道的相对于中心点的宽高偏移输出,以及具有
64
通道的表观特征输出,所述预设通道数等同于所述预设类别的数目
。3.
根据权利要求2所述的方法,其特征在于,所述预设通道数以及所述预设类别的数目为7,所述预设类别包括行人

自行车

摩托车

轿车

卡车

巴士和三轮车
。4.
根据权利要求1所述的方法,其特征在于,所述目标检测模型的训练过程,包括:将用于训练的图像输入至所述目标检测模型,得到所述图像中各目标对象的位置信息以及表观特征;针对每一目标对象的位置信息及表观特征,按照设定的目标函数计算所述位置信息及所述表观特征的损失值,并以损失值最小化为目标,更新所述目标检测模型的参数;其中,所述用于训练的图像包括至少多个预设类别下的多个目标对象的图像
。5.
根据权利要求4所述的方法,其特征在于,所述位置信息包括目标中心点,所述按照设定的目标函数计算所述位置信息的损...

【专利技术属性】
技术研发人员:颜城城王忠
申请(专利权)人:熵基科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1