一种面向交通场景的行人检测方法技术

技术编号：40874154 阅读：4 留言：0更新日期：2024-04-08 16:42

本发明专利技术属于计算机视觉应用技术领域，公开了一种面向交通场景的行人检测方法。建立行人检测模型，采用有监督的学习方法进行训练；训练时根据检测结果调整行人检测模型中卷积核的权重，训练完成后的行人检测模型用于检测识别。使用跨阶段网络结构和设计新的残差模块以改进原有的骨干网络，减少算法所需的计算量，采用、设计特征增强模块和自适应融合金字塔结构，提高不同尺度行人目标的检测精度。同时，该方法中也设计了加权式Soft‑NMS的后处理方法以提升行人间遮挡的检测效果。实验结果表明，本发明专利技术可以在满足实时检测的需求下提高行人目标的检测精度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机视觉应用，尤其涉及一种面向交通场景的行人检测方法。

技术介绍

1、随着国民经济的快速发展与社会基础设施的不断完善，道路交通条件迎来了极大的改善。良好的道路条件和快速发展的城市化促进了中国汽车产业的蓬勃发展，使得我国机动车保有量不断地上升。为实现道路交通的高效与便捷，减少交通安全事故的发生，将人们从机动车操作中解放出来，提出了自动驾驶技术。自动驾驶主要包含了三个核心点，分别是周边环境感知、行驶决策规划、控制方案执行。实现自动驾驶需要人工智能、计算机视觉和全球定位等技术的协同合作，使得汽车可以不需依赖人为控制独立自主进行行驶。可以预见的是，一旦自动驾驶汽车真正实现了大规模的商业化，结合当前高速、低时延的5g车联网网络为自动驾驶行人赋能，人们的出行安全会得到极大的改善，交通事故率进一步下降，将避免更多的人员伤亡和直接经济财产的损失。

2、行人检测作为智慧交通的重要技术，在自动驾驶或交通监控等场景下发挥着重要的作用。良好的行人检测效果可以辅助自动驾驶系统实时准确地检测出行人位置，进而为自动驾驶系统后续的行驶决策提供信息，对于保障行人的安全，实现便捷、安全的智慧交通具有重要的意义。行人检测任务中经常出现行人尺度变化大和行人间相互遮挡等现象，具体到交通场景下更是存在着场景复杂多变、小尺度行人较多等难点问题，这些问题较大地影响着行人检测的效果。除上述问题外，行人检测特别是交通场景下的行人检测还需满足实时检测的需求。

技术实现思路

1、针对以上行人检测中存在的问题，

2、本专利技术的技术方案为：一种面向交通场景的行人检测方法，建立行人检测模型，采用有监督的学习方法进行训练；训练时根据检测结果调整行人检测模型中卷积核的权重，训练完成后的行人检测模型用于检测识别；

3、所述行人检测模型包括用于特征提取的骨干网络、瓶颈结构和检测头；骨干网络部分在darknet-53的基础上引入跨阶段局部网络结构，设计inception-resblock模块替换骨干网络部分原残差模块；瓶颈结构部分包括特征增强模块fem和使用融合注意力模块fan的自适应融合特征金字塔结构；

4、待检测的图片经骨干网络进行特征提取，得到特征图；将骨干网络中最后一层生成的特征图送入特征增强模块；特征增强模块处理后的特征图、骨干网络中倒数第二层的特征图、骨干网络中倒数第三层的特征图分别送入到自适应融合特征金字塔不同网络层中；通过检测头分别对经自适应融合特征金字塔融合后的特征图进行预测，得到最终的分类结果和回归结果。

5、所述特征增强模块包括空间金字塔sppf结构和通道注意力eca两部分；在空间金字塔sppf结构上，设置一个卷积层、三个连续的3×3形式的最大池化层和一个跳跃连接，对卷积层和最大池化层的四个输出结果加以拼接；在空间金字塔sppf结构之后，引入通道注意力eca；对空间金字塔sppf结构输出的特征图进行全局平均池化，得出一个一维特征向量，再使用卷积核大小为s的一维卷积对一维特征向量进行处理，使用sigmoid激活函数计算一维特征向量各个通道中的权重值，权重值和空间金字塔sppf结构输出的特征图进行点乘运算，得到最后的输出特征图。

6、所述通道注意力的流程描述为：

7、（1）

8、其中，表示空间金字塔sppf结构输出的特征图，表示点乘操作，表示卷积核大小为的卷积操作，的大小由公式（2）的计算结果来确定，表示全局平均池化操作；

9、（2）

10、其中表示通道的维度数，为1，为2；表示距离数值最近的奇数。

11、所述融合注意力模块以加权的方式对自适应融合特征金字塔结构中每一层的特征图进行调整；

12、融合注意力模块fan首先将上一层处理后的最终特征图进行二倍的上采样操作，之后与当前层的特征进行3×3的卷积操作提取特征信息，再使用1×1的卷积操作降维；经过全局平均池化后得到维的向量，经过sigmoid激活函数得到最终的权重向量；最终的权重向量与上一层的中间特征图进行点乘操作，得到最终包含融合权重注意力的特征图；融合注意力模块整个过程描述为：

13、（3）

14、其中，是最终包含融合权重注意力的特征图，为sigmoid函数，为全局平均池化操作，为卷积操作，表示自适应融合特征金字塔结构中第层处理后的特征图，表示骨干网络从底到上结构中的第个特征图；表示拼接操作；表示点乘操作；表示自适应融合特征金字塔结构从顶到下结构中的第个特征图。

15、所述骨干网络部分中的inception-resblock模块为两支路，分别为第一支路和第二支路；第一支路为一个1 × 1卷积层和一个3 × 3卷积层；第二支路为一个1 × 1卷积层和两个3 × 3卷积层；原始输入分别通过两支路输出，输出结果拼接后使用1 × 1的卷积调整后再与原始输入相加。

16、所述骨干网络部分中使用跨阶段局部网络结构对darknet-53网络进行调整，采用分割的方式将梯度流通过不同的网络路径传播；将darknet-53网络中的最后一个残差模块加以调整，将原来的3×3常规卷积调整为可变形卷积。

17、检测结果采用加权式 soft-nms获取；将最高置信度得分的预测框与置信度得分大于0.6的预测框根据公式（4）合并得到最佳的预测框：

18、（4）

19、（5）

20、其中为最终的预测框，为每一个预测框设定的权重值，为预测框的数量，代表第个预测框，表示第个预测框的置信度分数，表示第个预测框与最大置信度得分的预测框的 iou 分值。

21、本专利技术的有益效果为：本专利技术的算法基础是yolo算法，然后在此基础上设计并实现了针对行人目标的检测方法。从道路上行人检测的实际需求出发，设计特征增强模块处理行人间尺度跨度大的问题；提出inception-resblock结构，并结合其他结构改进骨干网络以加快检测速度、提升特征提取的效果；提出融合注意力模块以构成自适应融合金字塔提升不同尺度的检测效果，尤其是小目标的检测效果；使用加权式soft-nms改善行人检测的遮挡问题。经过实验证明本专利技术可以在满足实时检测的情况下很好地检测出各种目标的行人，具有很好的检测效果。

本文档来自技高网...

【技术保护点】

1.一种面向交通场景的行人检测方法，其特征在于，建立行人检测模型，采用有监督的学习方法进行训练；训练时根据检测结果调整行人检测模型中卷积核的权重，训练完成后的行人检测模型用于检测识别；

2.根据权利要求1所述的面向交通场景的行人检测方法，其特征在于，所述特征增强模块包括空间金字塔SPPF结构和通道注意力ECA两部分；在空间金字塔SPPF结构上，设置一个卷积层、三个连续的3×3形式的最大池化层和一个跳跃连接，对卷积层和最大池化层的四个输出结果加以拼接；在空间金字塔SPPF结构之后，引入通道注意力ECA；对空间金字塔SPPF结构输出的特征图进行全局平均池化，得出一个一维特征向量，再使用卷积核大小为s的一维卷积对一维特征向量进行处理，使用Sigmoid激活函数计算一维特征向量各个通道中的权重值，权重值和空间金字塔SPPF结构输出的特征图进行点乘运算，得到最后的输出特征图。

3.根据权利要求2所述的面向交通场景的行人检测方法，其特征在于，所述通道注意力的流程描述为：

4.根据权利要求1-3任一所述的面向交通场景的行人检测方法，其特征在于，所述融合注意力

5.根据权利要求2所述的面向交通场景的行人检测方法，其特征在于，所述骨干网络部分中的Inception-Resblock模块为两支路，分别为第一支路和第二支路；第一支路为一个1× 1卷积层和一个3 × 3卷积层；第二支路为一个1 × 1卷积层和两个3 × 3卷积层；原始输入分别通过两支路输出，输出结果拼接后使用1 × 1的卷积调整后再与原始输入相加。

6.根据权利要求5所述的面向交通场景的行人检测方法，其特征在于，所述骨干网络部分中使用跨阶段局部网络结构对Darknet-53网络进行调整，采用分割的方式将梯度流通过不同的网络路径传播；将Darknet-53网络中的最后一个残差模块加以调整，将原来的3×3常规卷积调整为可变形卷积。

7.根据权利要求6所述的面向交通场景的行人检测方法，其特征在于，所述检测结果采用加权式 Soft-NMS获取；将最高置信度得分的预测框与置信度得分大于0.6的预测框根据公式（4）合并得到最佳的预测框：

...

【技术特征摘要】

2.根据权利要求1所述的面向交通场景的行人检测方法，其特征在于，所述特征增强模块包括空间金字塔sppf结构和通道注意力eca两部分；在空间金字塔sppf结构上，设置一个卷积层、三个连续的3×3形式的最大池化层和一个跳跃连接，对卷积层和最大池化层的四个输出结果加以拼接；在空间金字塔sppf结构之后，引入通道注意力eca；对空间金字塔sppf结构输出的特征图进行全局平均池化，得出一个一维特征向量，再使用卷积核大小为s的一维卷积对一维特征向量进行处理，使用sigmoid激活函数计算一维特征向量各个通道中的权重值，权重值和空间金字塔sppf结构输出的特征图进行点乘运算，得到最后的输出特征图。

3.根据权利要求2所述的面向交通场景的行人检测方法，其特征在于，所述通道注意力的流程描述为：

4.根据权利要求1-3任一所述的面向交通场景的行人检测方法，其...

【专利技术属性】
技术研发人员：毕远国，刘纪康，胡兵，黄子烜，刘雨霏，项天傲，汪美荃，付饶，
申请(专利权)人：东北大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人