基于细粒度目标分类的多视角多目标识别方法技术

技术编号:33541690 阅读:35 留言:0更新日期:2022-05-21 09:51
本发明专利技术公开了一种基于细粒度目标分类的多视角多目标识别方法,方法包括:采集多个视角、多个目标的图像;对每个视角中的图像目标进行裁剪,保存为单个目标;针对每个视角下的单目标图像,通过渐进式训练方法获取目标预测概率分布;计算图像真实类别和预测类别之间的损失;对计算出的损失进行优化;重复第三步后的内容,直到损失达到预设阈值,使算法收敛;将不同视角中每个目标预测出的类别分别标注到对应的原图中,完成多视角、多目标识别。本发明专利技术充分利用了细粒度识别的优势,解决了由于目标类间差异小、类内差异大而无法准识别目标的难题,同时充分利用不同视角之间信息的一致性和互补性,实现了多视角、多目标识别。多目标识别。多目标识别。

【技术实现步骤摘要】
分布;
[0013]步骤4,对于每个阶段得到的预测概率分布,利用交叉熵损失函数CE计算图像真 实类别和预测类别之间的损失;
[0014]步骤5,对步骤4计算出的损失进行优化;
[0015]步骤6,重复步骤3至5,直到图像预测类别与图像真实类别的损失达到预设阈值, 使算法收敛;
[0016]步骤7,完成细粒度目标识别分类后,将不同视角中每个目标预测出的类别分别标 注到对应的原图中,完成多视角、多目标识别。
[0017]进一步地,步骤3具体过程包括:
[0018]步骤3

1,对每个视角下的单个目标图像d∈R3×
W
×
H
,将其均等切割分成n
×
n个小块, 每个小块的维度为其中n为超参数,W、H分别为目标图像的宽和高;
[0019]步骤3

2,对切割分成的n
×
n个小块进行随机打散,并重新拼接成一张新的图像 P(d,n);
[0020]步骤3

3,利用特征提取网络对输入图像P(d,n)进行特征提取,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于细粒度目标分类的多视角多目标识别方法,其特征在于,所述方法包括以下步骤:步骤1,拍摄、采集多个视角、多个目标的图像;步骤2,对每个视角中的图像目标进行裁剪,保存为单个目标;步骤3,针对每个视角下的单个目标图像,通过渐进式训练方法获取目标预测概率分布;步骤4,对于每个阶段得到的预测概率分布,利用交叉熵损失函数CE计算图像真实类别和预测类别之间的损失;步骤5,对步骤4计算出的损失进行优化;步骤6,重复步骤3至5,直到图像预测类别与图像真实类别的损失达到预设阈值,使算法收敛;步骤7,完成细粒度目标识别分类后,将不同视角中每个目标预测出的类别分别标注到对应的原图中,完成多视角、多目标识别。2.根据权利要求1所述的基于细粒度目标分类的多视角多目标识别方法,其特征在于,步骤3具体过程包括:步骤3

1,对每个视角下的单个目标图像d∈R3×
W
×
H
,将其均等切割分成n
×
n个小块,每个小块的维度为其中n为超参数,W、H分别为目标图像的宽和高;步骤3

2,对切割分成的n
×
n个小块进行随机打散,并重新拼接成一张新的图像P(d,n);步骤3

3,利用特征提取网络对输入图像P(d,n)进行特征提取,得到图像的特征矩阵其中H
l
,W
l
,C
l
分别为训练阶段l的特征图的高度、宽度和图像的颜色通道数;步骤3

4,针对最后S个训练阶段,通过压缩块将训练阶段l的中间输出结果F
l
压缩为二维特征向量V
l
,特别地,将最后S个训练阶段的图像特征向量进行拼接,得到图像的拼接特征向量V
concat
,V
concat
=concat[V
L

S+1
,...,V
L
‑1,V
L
],L为总的训练阶段数;步骤3

5,针对最后S个训练阶段,通过分类器得到图像的预测概率分布向量y
l
,特别地,对于所述拼接特征向量,通过分类器获得其预测概率分布向量为y
concat
,步骤3

...

【专利技术属性】
技术研发人员:顾晶晶高自强
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1