【技术实现步骤摘要】
一种基于多帧特征聚合的动态目标检测方法及装置
[0001]本专利技术涉及计算机视觉
,特别涉及一种基于多帧特征聚合的动态目标检测方法及装置。
技术介绍
[0002]在动态目标检测的研究中,人们尝试将静态图像的目标检测直接应用于视频的每一帧中,但这种方法没有利用好视频是一个空间与时间信息集合体的特征,因此容易受到遮挡、模糊以及光照条件等变化带来的准确性降低等问题。
技术实现思路
[0003]本专利技术提供了一种基于多帧特征聚合的动态目标检测方法及装置,以解决现有的动态目标检测方法容易受到遮挡、模糊以及光照条件等变化带来的准确性降低的技术问题。
[0004]为解决上述技术问题,本专利技术提供了如下技术方案:
[0005]一方面,本专利技术提供了一种基于多帧特征聚合的动态目标检测方法,包括:
[0006]在Faster RCNN的全连接层后添加关系模块;其中,所述关系模块包括全局关系模块和局部关系模块;
[0007]从视频中与关键帧相邻的帧中随机选取多帧作为局部帧;从视频中随机选取多帧作为全局帧;其中,所述关键帧中包含待检测的动态目标;
[0008]通过所述全局关系模块将所述全局帧的语义特征聚合到所述局部帧和所述关键帧,得到增强局部帧和第一增强关键帧;通过所述局部关系模块将所述增强局部帧的语义特征和位置特征聚合到所述第一增强关键帧,得到第二增强关键帧;通过所述局部关系模块将所述第二增强关键帧中除选定候选区域外的其他候选区域的语义特征和位置特征聚合到选定候选区域, ...
【技术保护点】
【技术特征摘要】
1.一种基于多帧特征聚合的动态目标检测方法,其特征在于,包括:在Faster RCNN的全连接层后添加关系模块;其中,所述关系模块包括全局关系模块和局部关系模块;从视频中与关键帧相邻的帧中随机选取多帧作为局部帧;从视频中随机选取多帧作为全局帧;其中,所述关键帧中包含待检测的动态目标;通过所述全局关系模块将所述全局帧的语义特征聚合到所述局部帧和所述关键帧,得到增强局部帧和第一增强关键帧;通过所述局部关系模块将所述增强局部帧的语义特征和位置特征聚合到所述第一增强关键帧,得到第二增强关键帧;通过所述局部关系模块将所述第二增强关键帧中除选定候选区域外的其他候选区域的语义特征和位置特征聚合到选定候选区域,得到第三增强关键帧;基于所述第三增强关键帧,得到当前动态目标的检测结果。2.如权利要求1所述的基于多帧特征聚合的动态目标检测方法,其特征在于,将所述全局帧的语义特征聚合到所述局部帧和所述关键帧,包括:使用广义余弦相似度来度量两个候选区域之间的语义相似度,从而判断两个候选区域是否同属一个类别,表达式为:其中,φ(.)和ψ(.)代表变换函数,表示第k帧第i个候选区域,表示第f帧第j个候选区域;表示和之间的语义相似度,T表示转置;使用softmax函数对所有候选区域进行相似性归一化处理,将各个输出节点的输出值范围映射到[0,1],并且约束各个输出节点的输出值和为1,表达式为:其中,表示语义相似度的归一化处理结果;将所述全局帧的语义特征聚合到所述局部帧和所述关键帧,表达式为:其中,表示第k帧第i个候选区域的语义特征聚合结果,Ω是为聚合全局帧的语义特征随机选择的帧索引集,N为每帧中的候选区域个数。3.如权利要求1所述的基于多帧特征聚合的动态目标检测方法,其特征在于,将所述增强局部帧的语义特征和位置特征聚合到所述第一增强关键帧,包括:构造关系函数,将B中候选区域对象集的语义特征和位置特征聚合到P帧中第n个候选区域,即关系特征f
R(n)
表示为:其中,表示B中第l个对象的语义特征,W
v
是线性变换矩阵;ω
ln
为关系权重因子,表示来自其他对象的影响,表示为:
其中,和分别表示B中第l个候选框和P帧中第n个候选框之间的位置特征权重和语义特征权重;表示B中的对象集和P帧中第n个对象之间的位置特征权重和语义特征权重之和;所述局部关系模块通过r个关系特征模块来进一步增强每个候选区域的语义特征信息和位置特征信息,表示为:其中,表示P帧中第n个候选区域的语义特征,表示经过第r个关系特征模块后得到的关系特征,f
ra
(p
n
,B)表示P帧中的第n个候选区域特征通过连接r个关系特征和原始语义特征后得到的增强特征;使用f
ra
(P,B)表示所有增强的候选区域特征的集合,即P中的所有候选区域都是通过B中的候选区域的特征来增强的;将增强局部帧的语义特征和位置特征聚合到第一增强关键帧,表达式为:K...
【专利技术属性】
技术研发人员:许海涛,时月红,林福宏,周贤伟,
申请(专利权)人:北京科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。