一种基于级联优化的行人目标检测方法技术

技术编号：24757544 阅读：104 留言：0更新日期：2020-07-04 09:28

本发明专利技术涉及一种基于级联优化的行人检测方法，属于计算机视觉中的行人检测领域。首先利用基于无监督注意力机制的候选区域生成网络产生不同行人候选目标区域，然后利用设计的优化网络从不同特征层上提取候选目标区域，逐层对样本进行优化，最终得到准确的行人目标预测。

A pedestrian target detection method based on cascade optimization

全部详细技术资料下载

【技术实现步骤摘要】
一种基于级联优化的行人目标检测方法
本专利技术涉及一种基于级联优化的行人目标检测方法，属于计算机视觉中的行人检测领域。
技术介绍
行人检测技术是计算机视觉领域中的一个基础问题，在自动驾驶，自动机器人等，视频监控等领域都有广泛应用。目前行人检测中的主要挑战在于遮挡，尺度，复杂背景，目标变形等。首先，道路中的车辆和行人都较多，因此行人之间的遮挡，行人被建筑物、汽车等遮挡都可能会比较严重，类内遮挡和类间遮挡都可能给检测器带来挑战。其次，由于行人和摄像头的距离不一致，因此呈现在图像中的行人尺度范围可能变化较大，这种尺度问题可能会使检测不准确。另外，存在建筑物，树木等也可能与行人的形态相似，使检测器造成误判。最后，行人本身也可能姿态各异，甚至部分行人可能像素模糊，使检测器无法准确判断。一般的行人检测方法一般都是基于预设框的，可以分为单阶段与双阶段的检测器。单阶段检测指网络直接生成候选样本和对应的置信度，从而对行人目标做出预测。双阶段检测指网络产生候选框之后，再在特征层上提取出相应区域，以做进一步的分类和回归优化。单阶段与双阶段的检测中都会用到一种特征金字塔的结构，即从不同的特征层中检测不同的目标，通常按照尺度分类，较深的特征层认为感受野较大，因此用来检测尺度较大的目标。常用的单阶段检测方法无法对难样本如干扰背景，亦无法对模糊行人进行准确判断，常用的双阶段方法将所有样本都进行再分类，反而会破坏已有的部分检测结果的准确性。目前无相关文献报导。
技术实现思路
本专利技术技术问题为：针对现有...

【技术保护点】
1.一种基于级联优化的行人目标检测方法，其特征在于，包括以下步骤：/n步骤一：在一般区域生成网络的基础上，根据特征对于目标区域的响应特点，在待处理网络特征的基础上增加一个子网络，得到不同行人候选目标区域，每个候选目标区域均包含区域尺度和置信度；/n步骤二：根据步骤一得到的不同行人候选目标区域尺度范围及置信度分布情况，进行不同级别优化网络的设计，分别得到基于输入图像和网络不同层级对应的优化网络结构，其输入为不同的候选区域，输出为优化后候选区域的置信度和坐标值；/n步骤三：使不同尺度和置信度的候选区域通过不同的优化子网络，采用不同的优化网络对步骤一中不同行人候选目标区域分别进行修正，最终得到准确的行人目标检测结果。/n

【技术特征摘要】
1.一种基于级联优化的行人目标检测方法，其特征在于，包括以下步骤：
步骤一：在一般区域生成网络的基础上，根据特征对于目标区域的响应特点，在待处理网络特征的基础上增加一个子网络，得到不同行人候选目标区域，每个候选目标区域均包含区域尺度和置信度；
步骤二：根据步骤一得到的不同行人候选目标区域尺度范围及置信度分布情况，进行不同级别优化网络的设计，分别得到基于输入图像和网络不同层级对应的优化网络结构，其输入为不同的候选区域，输出为优化后候选区域的置信度和坐标值；
步骤三：使不同尺度和置信度的候选区域通过不同的优化子网络，采用不同的优化网络对步骤一中不同行人候选目标区域分别进行修正，最终得到准确的行人目标检测结果。

2.根据权利要求1所述的基于级联优化的行人目标检测方法，其特征在于：所述步骤一具体实现如下：
设I为输入图像，经神经网络逐层处理后，最终得到特征F：

上式中代表神经网络的作用函数；
设图像I大小为W×H，W和H分别代表图像的宽和高，网络截至特征图F的总步长为S，则特征F的大小为记为Ws×Hs×C,其中C为通道的数目，特征图F和输入图像I是尺度放缩对应的关系；令F自主学习一个特征增强的监督特征f，f大小为Ws×Hs×1，Ws和H3分别代表监督特征的宽和高，其特点是背景目标对应的区域响应较低，即经Sigmoid函数处理后对应的值小于0.3，前景目标区域对应的响应较高，即经Sigmoid函数处理后其值均大于0.7，然后令f和初始特征F的每个通道都相乘，得到区域增强的特征F′，获得f的具体操作为令F通过3个卷积加ReLu激活函数操作，卷积层的步长均为1，中间设置不同的通道数量，最后一个卷积层的通道设置为1，再通过sigmoid层使特征范围约束在0到1之间，即得到监督特征f，最后对区域增强后的特征F分别作分类和回归操作，得到不同行人候选目标区域。

3.根据权利要求1所述的基于级联优化的行人目标检测方法，其特征在于：所述步骤二：优化网络的设计具体实现如下：
优化网络的输入为不同行人候选目标区域，输出为优化后候选区域的置信度和坐标值，设某一输入候选区域大小为Wt×Ht,t＝0,1,2,3,t＝0表示该区域从原图中提取出来，t＝1,2,3分别表示该区域从VGG16网络的第三，第四，第五卷积层中...

【专利技术属性】
技术研发人员：冷彪，郝杰，
申请(专利权)人：深圳北航新兴产业技术研究院，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人