一种基于全局和局部信息融合的目标检测方法技术

技术编号：23985162 阅读：121 留言：0更新日期：2020-04-29 13:10

本发明专利技术涉及一种基于全局和局部信息融合的目标检测方法，属于视频图像处理领域。首先，将场景送入卷积神经网络中增加网络的记忆能力，使网络更好的学习场景上下文信息，得到全局的场景特征；其次，借鉴注意力机制，自适应地建立物体与物体之间的关系，得到局部的物体特征；最后，通过信息传递融合场景特征和物体特征增强特征表达。本发明专利技术的优点是，同时考虑全局场景特征和局部物体特征，并通过信息传递更好的表征目标特征，大量的对比实验表明，其检测性能明显优于其它目标检测方法。

A target detection method based on global and local information fusion

全部详细技术资料下载

【技术实现步骤摘要】
一种基于全局和局部信息融合的目标检测方法
本专利技术属于视频图像处理领域，尤其是指一种基于全局和局部信息融合的目标检测方法。
技术介绍
目标检测在自主驾驶、机器人、视频监控、行人检测等领域有着广泛的应用，是计算机视觉和机器学习领域的研究热点。经典的目标检测技术主要是基于手动特征的使用，可以分为三个步骤：(1)目标区域的选择；(2)特征提取；(3)分类。在第一步中，广泛采用滑动窗口策略，利用不同维数和长宽比的滑动窗口，对候选区域进行详尽的搜索。第二步对候选区域进行分析，可以使用多种技术进行特征提取，如尺度不变特征变换(SIFT)、方向梯度直方图(HOG)和加速鲁棒特征(SURF)等传统方式。第三步，利用支持向量机、AdaBoost等分类器对候选区域进行分类。虽然经典方法得到了良好的检测效果，但仍然存在一些限制，阻碍了其在速度和精度上的突破。例如，由于滑动窗口策略会在原始图像中捕获许多候选区域，并且需要逐个提取区域的特征，因此经典的目标检测方法非常耗时。而且，由于人工设计的特征对物体形态、光照和遮挡的变化非常敏感，导致传统的目标检测方法缺乏鲁棒性。近年来，一些深度学习技术被应用到物体检测中，克服了传统方法的局限性。目前最先进的基于深度学习的检测器大致可以分为两类。一种是两阶段方法，首先通过选择性搜索(SelectiveSearch)、EdgeBoxes、深度掩码(DeepMask)或区域建议网络(RPN)形成一系列候选对象建议，然后将这些建议框输入卷积神经网络进行分类。另一种是一阶段方法，它直接预测多个对象在整个...

【技术保护点】
1.一种基于全局和局部信息融合的目标检测方法，其特征在于包括下列步骤：/n(1)读入一幅图像I；/n(2)提取场景上下文信息；/n通过捕捉不同的对象之间的相互作用信息以及对象与场景之间的相互作用等信息能够有效提升目标检测性能，将图像I输送到一个具有13个卷积层和4个池化层的深度网络获得特征图，特征图作为两部分的输入，一部分作为场景上下文模块的输入，另一部分是通过区域建议网络RPN得到区域建议ROIs，然后作为关系模块的输入，在场景上下文模块中，在所有特征图上执行ROI-池化、拼接以及全连层接等操作，获得场景特征f

【技术特征摘要】
1.一种基于全局和局部信息融合的目标检测方法，其特征在于包括下列步骤：
(1)读入一幅图像I；
(2)提取场景上下文信息；
通过捕捉不同的对象之间的相互作用信息以及对象与场景之间的相互作用等信息能够有效提升目标检测性能，将图像I输送到一个具有13个卷积层和4个池化层的深度网络获得特征图，特征图作为两部分的输入，一部分作为场景上下文模块的输入，另一部分是通过区域建议网络RPN得到区域建议ROIs，然后作为关系模块的输入，在场景上下文模块中，在所有特征图上执行ROI-池化、拼接以及全连层接等操作，获得场景特征fs，并作为场景GRUs(1)的输入；
(3)建立物体之间的关系模型
为了对RoIs进行分类和回归，关系模块不仅利用卷积层提取的外观特征和物体的坐标信息，而且利用所有周围物体的信息作为关系GRUr(1)的输入；
给定N个对象的输入集其中ftn是卷积神经网络提取的第n个物体的原始外观特征，表示由物体边界框的4维特征组成的第n个对象的位置特征，边界框的特征包括宽度w，高度h和中心坐标(x，y)，关系通道是处理不同对象之间关系的模块，Nr是关系通道数量，Nr＝64，通过对象关系通过模块，可以得到融合周围所有对象位置信息的融合所有关系通道上的向量和ftn获得物体特征ftn′，作为关系GRUr(1)的输入；
(4)建立信息传递模型场景GRUs(1)和关系GRUr(1)相互通信，以不断跟新物体特征，GRUs(1)、GRUs(2)、GRUr(1)和GRUr(2)均有两个门，一个称为更新门z，它决定要传递多少来自以前时间和当前时间的信息，另一个门是复位门r，它控制有多少过去的信息被遗忘，使用两组并行方式传递信息，一组包括场景GRUs(1)和关系GRUr(1)，另一组包括场景GRUs(2)和关系GRUr(2)，利用原始的外观特征来表示网络的初始状态hi，场景GRUs(1)、GRUs(2)和关系GRUr(1)、GRUr(2)的处理机制是相同的，得到最终的场景特征和物体特征的融合信息；
(5)建立物体类别预测和边界框回归模型；
将场景GRUs(2)和关系GRUr(2)获得的综合信息输入到全连接层，并经过softmax预测物体的类别和边界检测框，预测物体分类是利用已经获得的融合特征信息，通过全连接层和softmax计算每个建议框应该具体属于哪个类别，并输出所属分类的概率；同时，利用边界框回归获得每个建议框的位置偏移量，使目标边界检测框更加精准，实现目标检测。

2.根据权利要求1所述的一种基于全局和局部信息融合的目标检测方法，其特征在于：步骤(3)中关系通道各模块的处理机制是相同的，其中一个关系通道模块的工作原理是：
首先，通过点积运算得到第m个和第n个物体之间的外观权重

其中，WK、WQ是将第m个物体和第n个物体原始外观特征ftm和ftn映射到子...

【专利技术属性】
技术研发人员：齐妙，王建中，张燕妮，孔俊，吕英华，郑彩侠，徐慧，
申请(专利权)人：东北师范大学，
类型：发明
国别省市：吉林;22

全部详细技术资料下载我是这个专利的主人