一种基于异构多分支深度卷积神经网络的监控视频人头检测方法技术

技术编号：24123071 阅读：60 留言：0更新日期：2020-05-13 03:41

本发明专利技术提供一种基于异构多分支深度卷积神经网络的监控视频人头检测方法，可应用于视频监控领域中的各种小目标检测。为了提高目标检测算法的检测精度，对YOLOv3结构进行改造，将其主干网络修改为双主干网络结构，其中一个分支以DenseNet121网络为主干网络，去掉其最后的FC层，然后将其基础结构由CBL修改为BRC结构；另外一个分支采用Darknet53为主干网络，去掉其最后FC层，该分支的BRC结构不作修改。本发明专利技术设计的双主干结构网络模型取名为Dense_YOLO网络，通过两个不同结构的主干网络提取的特征进行特征融合，提高了检测效果，减少了误检和漏检，适用于小目标检测，效果优于以Darknet53作为主干网络的YOLOv3模型。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于异构多分支深度卷积神经网络的监控视频人头检测方法
本专利技术涉及计算机视觉中智能视频监控
，具体涉及一种基于异构多分支深度卷积神经网络的监控视频人头检测方法。
技术介绍
在大型的视频监控场所，如机场、火车站、停车场、银行等，摄像机数量很多，捕获的视频非常庞大，却给人们搜索有用信息带来了巨大的挑战。目前，智能视频监控技术已被应用于对视频进行自动处理和分析以节省昂贵的人力资源和时间成本。监控摄像头中的人头检测是智能视频监控系统的一个关键技术，是后续很多视频识别和分析任务的基础，比如人头部属性识别、人流量检测和行人跟踪等。在监控摄像头中，人头部尺寸往往较小，尤其是距离较远的行人，在遮挡和各种复杂的背景下，其检测难度较大，这种检测属于视频监控中的小目标检测范畴。目前已有的方法检测精度不高，误检和漏检较多。基于此，本专利技术提出了一种新的深度学习网络结构Dense_YOLO的小目标检测方法，用于精确地实现监控视频中的行人头部检测。与已有的方法相比，本专利技术所提出的方法通过融合不同结构主干网络之间的特征，获得更加抽象和丰富的特征表达，提高了检测效果，尤其对小尺度目标的检测效果，减少了误检和漏检。
技术实现思路
本专利技术的目的是提供一种适用于摄像机网络中行人头部检测及视频监控中其他小目标检测、提高检测精度的基于异构多分支深度卷积神经网络的监控视频人头检测方法。为了达到上述目的，本专利技术通过以下技术方案来实现：一种基于异构多分支深度卷积神经网络的监控视频...

【技术保护点】
1.一种基于异构多分支深度卷积神经网络的监控视频人头检测方法，其特征在于包括如下步骤：/nS1）数据增强/n使用Mixup方法对人头检测数据进行数据增强操作，使用线性插值的方法构建新的训练样本和标签来代替原样本和标签；/nS2）人头部位检测/nS2-1）构建卷积神经网络Dense_YOLO/n修改YOLOv3主干网络结构为双分支结构，其中一个分支以DenseNet121网络作为主干网络，去掉其最后一层FC层，另一个分支以Darknet53作为主干网络，去掉其最后一层FC层；将DenseNet121的基础结构由CBL结构修改为BRC结构，而Darknet53分支的BRC结构不作修改；/nS2-2）特征图层次选择与融合/n利用S2-1）中的双主干网络对增强后的训练数据进行训练；/n将两个主干网络获得的特征图进行融合，得到三层特征图，对应的输入通道数分别为256、512和1024；/n对最后一层特征图进行如下操作：首先，将它放进make embedding层中，通过后面的5层CBL结构后通道数减少一半；然后，分成两条路径，一条路径通过3×3卷积升维到原先的维度，再通过一个1×1卷积得到最终的...

【技术特征摘要】
1.一种基于异构多分支深度卷积神经网络的监控视频人头检测方法，其特征在于包括如下步骤：
S1）数据增强
使用Mixup方法对人头检测数据进行数据增强操作，使用线性插值的方法构建新的训练样本和标签来代替原样本和标签；
S2）人头部位检测
S2-1）构建卷积神经网络Dense_YOLO
修改YOLOv3主干网络结构为双分支结构，其中一个分支以DenseNet121网络作为主干网络，去掉其最后一层FC层，另一个分支以Darknet53作为主干网络，去掉其最后一层FC层；将DenseNet121的基础结构由CBL结构修改为BRC结构，而Darknet53分支的BRC结构不作修改；
S2-2）特征图层次选择与融合
利用S2-1）中的双主干网络对增强后的训练数据进行训练；
将两个主干网络获得的特征图进行融合，得到三层特征图，对应的输入通道数分别为2...

【专利技术属性】
技术研发人员：王慧燕，潘峥昊，
申请(专利权)人：浙江工商大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人