基于特征融合的自适应场面监视视频目标检测方法和系统技术方案

技术编号：39779295 阅读：8 留言：0更新日期：2023-12-22 02:24

本发明专利技术公开了一种基于特征融合的自适应场面监视视频目标检测方法和系统，解决了在机场场面监视场景下视频目标检测中时序上下文信息未充分融合及检测速度较慢的问题

全部详细技术资料下载

【技术实现步骤摘要】
基于特征融合的自适应场面监视视频目标检测方法和系统

[0001]本专利技术属于计算机视觉中视频目标检测
，更具体地，涉及一种机场环境下，基于特征融合的自适应场面监视视频目标检测方法和系统，对机场航空器及车辆目标进行识别与检测
。

技术介绍

[0002]目标检测是计算机视觉领域的一项非常重要的研究课题
。
目标检测模型不仅可以应用于各种安防监控系统
、
自动驾驶系统
、
无人机等领域，而且还有着广泛的商业用途，例如人脸识别
、
车牌识别
、
医学影像分析等
。
随着深度学习技术的不断发展，越来越多的优秀的目标检测算法被提出，这使得目标检测有着更强的准确性
、
更快的速度和更高效的处理大量数据的能力
。
[0003]深度学习是一种人工智能的技术，它通过模拟人脑神经网络的结构和功能来实现机器学习
。
在图像目标检测方面，深度学习有着很多的优势，例如准确性高
、
速度快
、
能够处理大量数据等
。
因此，深度学习在图像目标检测方面得到了广泛的应用
。
但是在视频目标检测方面，面临着更为复杂的困难和挑战
。
首先，视频数据量巨大，处理起来非常耗时，这需要算法具备更高的速度和效率
。
其次，视频中的目标可能会发生运动
、
遮挡
、
形变等变化，这些...

【技术保护点】

【技术特征摘要】
1.
一种基于特征融合的自适应场面监视视频目标检测方法，其特征在于，所述方法包括以下步骤：步骤1：确定包括待检测目标的视频流，所述视频流包括多帧图像序列，图像中包括待检测目标；步骤2：采用
ResNet
网络作为特征提取网络
Nfeat
，采用
RFCN
网络作为分类定位网络
Ntask
，设计一个卷积神经网络作为权重网络
Nw
，设计一个基于卷积神经网络的光流网络
FlowNet
；步骤3：若当前帧为视频流第一帧，则将当前帧选为关键帧，利用所述特征提取网络
Nfeat
提取当前帧图像的特征，然后将其特征图直接输入所述分类定位网络
Ntask
，进行分类和定位，得到目标检测结果；步骤4：若当前帧不是视频流第一帧，则根据时序自适应关键帧动态调度策略，计算当前帧和前一个关键帧的光流运动场及特征时序一致性判别矩阵
Qk2i
，判断当前帧是关键帧或者非关键帧；步骤5：若当前帧是关键帧，则利用所述特征提取网络
Nfeat
提取当前帧图像的特征，并计算当前帧与前一个关键帧的特征图经过权重网络
Nw
聚合后的融合特征图，然后进行分类和定位，得到目标检测结果；步骤6：若当前帧是非关键帧，则采用空间自适应局部特征更新方法，根据所述步骤4得到的一致性判别矩阵
Qk2i
和前一个关键帧的特征图计算当前帧的特征图，然后进行分类和定位，得到目标检测结果
。2.
根据权利要求1所述的基于特征融合的自适应场面监视视频目标检测方法，其特征在于，步骤2所述采用
ResNet
网络作为特征提取网络
Nfeat
，采用
RFCN
作为分类定位网络
Ntask
，设计一个卷积神经网络作为权重网络
Nw
，设计一个基于卷积神经网络的光流网络
FlowNet
，具体包括：步骤2‑1：构造基于
ResNet
的特征提取网络
Nfeat
用于计算图像的特征图
。
这里使用经更改后的
ResNet
‑
101
模型，其中
ResNet
‑
101
将最后的分类层丢弃，将
conv5
的第一个块的步幅修改为1，在
conv5
中的所有
3x3
卷积核上应用
holing
算法，并在
conv5
后添加
3x3
卷积层，将特征通道维度减少到
1024。
将当前关键帧的图像输入
Nfeat
网络，输出得到关键帧的特征图
。
步骤2‑2：构造基于
RFCN
的分类定位网络
Ntask
用于计算当前帧的分类和定位
。
将当前帧计算获得的特征图输入进
Ntask
网络，输出得到当前帧的分类和定位
。
步骤2‑3：采用自适应权重的特征融合方式
。
构造基于卷积神经网络的权重网络
。
将当前帧特征图和前一个关键帧特征图一起输入网络，在最后一层池化层处理结束后，经由余弦相似度函数处理，获得重要性权重
。
根据权重，对两张特征图进行加权融合得到新的关键帧的特征图；步骤2‑4：构造基于卷积神经网络的光流网络
FlowNet
用于计算光流运动场
。
将当前帧和前一个关键帧一起输入
FlowNet
，输出得到当前帧的光流运动场
。3.
根据权利要求1所述的基于特征融合的自适应场面监视视频目标检测方法，其特征在于，步骤4所述若当前帧不是视频流第一帧，则根据时序自适应关键帧动态调度策略，计算当前帧和前一个关键帧的光流运动场及特征时序一致性判别矩阵
Qk2i
，判断当前帧是...

【专利技术属性】
技术研发人员：王欣，赵帅，刘冠，李涛，李敏乐，王晓磊，郭晓喻，王英杰，张雨松，
申请(专利权)人：苏州数智源信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人