【技术实现步骤摘要】
一种多运动目标视觉跟踪方法及装置
[0001]本专利技术属于计算机视觉跟踪
,特别涉及一种多运动目标视觉跟踪方法及装置。
技术介绍
[0002]现代计算机视觉跟踪通常在图像分类框架下进行网络模型预训练,这种训练方法鼓励提取不同类别目标之间的类间特征,对相同类别不同目标实体之间的类内特征取不敏感,然而,视觉跟踪的困扰之一在于相似目标的干扰,即在具有大量同类相似实例的场景中,相似目标干扰经常导致跟踪器漂移,给视觉跟踪带来很大困难,需要一种不增加网络训练负担、能提高相同类别不同目标实体的类内特征提取的视觉跟踪方法。
技术实现思路
[0003]本专利技术的目的在于提供一种多运动目标视觉跟踪方法及装置,通过优化损失函数进行网络训练使网络模型同时具有增加不同类别目标和相同类型不同目标实体的特征间距,从而解决当前图像分类框架下的多目标视觉跟踪对相同类型不同目标实体的特征区分度不高的缺陷。
[0004]本专利技术解决其技术问题提供的技术方案如下:
[0005]第一方面,本专利技术提供一种多运动目标视觉跟 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种多运动目标视觉跟踪方法,包括步骤:模型离线预训练和在线视觉跟踪,其特征在于,在所述模型离线预训练阶段,在原始损失函数具有类间约束的基础上融合一个具有类内约束的类内损失函数构成总损失函数,总损失函数替换原始损失函数对模型进行离线训练,以满足不同类别目标之间的类间特征向量间距和相同类别不同实体之间的类内特征向量间距同时增大。2.如权利要求1所述多运动目标视觉跟踪方法,其特征在于,所述在原始损失函数具有类间约束的基础上融合一个具有类内约束的损失函数的方法为:在原始损失函数L
inter
‑
class
上加入一个类内损失函数L
intra
‑
class
,融合后的总损失函数为:L
ins
‑
aware
=L
inter
‑
class
+γL
intra
‑
class
,γ为用于平衡两个损失函数的自适应权重参数。3.如权利要求2所述多运动目标视觉跟踪方法,其特征在于,所述L
inter
‑
class
采用交叉熵损失函数,用于引导主干网络学习具有不同类别目标之间的类间辨别能力的特征,被构造为对于属于第k类的第i个输入图像,通过最小化L
inter
‑
class
约束主干网络输出一个尽可能接近对应真实类向量Y
i
=Y
k
=(y
i1
,
…
,y
ik
,
…
,y
iM
)
T
的分类向量P
i
技术研发人员:黄姗姗,马龙,魏邹建,徐玉,彭扬帆,杨静,赵佳尧,杜江斌,吴海波,
申请(专利权)人:西安工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。