基于多层特征融合的FasterR-cnn上下文机制优化方法技术

技术编号：37702937 阅读：17 留言：0更新日期：2023-06-01 23:49

本发明专利技术涉及一种基于多层特征融合的Faster R

全部详细技术资料下载

【技术实现步骤摘要】
基于多层特征融合的Faster R
‑
cnn上下文机制优化方法

[0001]本专利技术属于目标识别
，涉及一种优化的上下文机制(基于多层特征融合的Faster R
‑
cnn上下文机制)的目标检测方法。

技术介绍

[0002]在一些高空监控的场景中，一些无源监控对于环境的捕捉在很长一段时间内是处于静态的，处于静态的摄像头捕捉到的画面相比于动态摄像头有捕捉到的画面在每一帧的分别上更具有长期的高度一致性。在捕捉到的视野中，处于不同月份不同天数的画面可能也具有十分的相似性，例如，轨道交通摄像头用于捕捉画面，在对收集到的画面进行分析处理时，尝试用距离这些画面相近的一段时间内的相关信息来帮助决定以及判断当前情况下的情境。这些通过包含过去记忆数据的注意力机制来完成。
[0003]视频目标检测架构建立在单帧模型之上，并通过合并来拟合其他帧的上下文线索(如传统HyperNet方式)，来处理视频数据中其余的问题，例如运动模糊、遮挡和罕见的姿势。这类处理方法有类似流的概念来聚合特征，或者使用相关性将当前时间步上的特征和相邻时间步紧密关联。上述大多数的视频检测方法都不太适合目标设置稀疏、不规则帧率的问题。例如，基于流的方法、3d卷积以及LSTMs这些通常比较密集、规则的帧率采样方法。
[0004]传统HyperNet方式。cnn通过输入图像进行提取特征，得到对应feature maps，对其输入rpn网络后产生得到对应的候选框，并实现对候选框的分类，分类包含对候选框内内容进行判别，判...

【技术保护点】

【技术特征摘要】
1.一种基于多层特征融合的Faster R
‑
cnn上下文机制优化方法，其特征在于，在传统的使用HyperNet提取预选框特征向量的基础上，基于改进的多层特征融合模块加入模型中，对图像不同层次的语义信息进行提取；并将传统采样方式改进为反池化；然后，将得到的特征向量与上下文注意力机制融合得到多信息特征向量，最终进行识别分类；该方法具体包括以下步骤：S1：将当前关键帧与相关上下文帧输入多层特征融合模块，对其提取预选框特征向量；S2：多层特征融合模块中卷积层深层次采用反池化进行上采样；S3：对于通过多层特征融合模块输出的当前关键帧与相关上下文帧的预选框特征向量，将其分别输入到注意力模块和构建短期记忆库的模块中；S4：当前关键帧的预选框特征向量经过长短期注意力模块，完成上下文相关特征的合并；S5：收集所得到的处理后的预选框特征向量，对其进行分类与框优化。2.根据权利要求1所述的基于多层特征融合的Faster R
‑
cnn上下文机制优化方法，其特征在于，步骤S1中，将当前帧作为关键帧，与和当前作为关键帧的前后相关帧一同被抽取分别输入到多层特征融合模块中，多层特征融合模块是基于改进的HyperNet方法，基于VGG网络，对卷积层的不同深度层次采用不同方式提取特征；具体方法是将1、2、5层特征联合，并将1、4、5层的深层特征联合，最后将两层特征进行通道拼接；然后，整个模块通过卷积层转发并生成聚集分层的特征图，然后将它们压缩到一个统一的空间，即超特征；最后，构建一个生成预选框网络，输出各个帧提取到的预选框特征向量。3.根据权利要求1所述的基于多层特征融合的Faster R...

【专利技术属性】
技术研发人员：万久地，潘纯洁，张前进，
申请(专利权)人：中国铁塔股份有限公司重庆市分公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人