一种加强SSD小目标行人检测性能的网络结构及检测方法技术

技术编号：21200648 阅读：148 留言：0更新日期：2019-05-25 01:28

本发明专利技术公开了一种加强SSD小目标行人检测性能的网络结构，包括：预处理模块、基础网络模块、附加特征提取模块、两级特征融合模块、分类和回归模块。本发明专利技术还公开了一种加强SSD小目标行人检测性能的检测方法，其特征在于，包括以下步骤：获取用于小目标行人检测的训练样本集并转换格式；初始化训练模型，对训练样本进行预处理；提取样本的浅层特征和深层特征，将深层特征的信息融合到浅层特征中，形成多尺度检测框架；进行网络参数的迭代更新；完成网络训练后进行测试。本发明专利技术在SSD算法的基础上引入了两级特征融合模块，有效利用了特征层之间的上下文信息，使深层网络信息能够较好地融合到浅层网络中，加强了SSD算法对小目标行人的检测性能。

A Network Structure and Detection Method for Strengthen the Performance of SSD Small Target Pedestrian Detection

The invention discloses a network structure to enhance the pedestrian detection performance of SSD small targets, which includes: preprocessing module, basic network module, additional feature extraction module, two-level feature fusion module, classification and regression module. The invention also discloses a detection method for enhancing the performance of SSD small target pedestrian detection, which is characterized by the following steps: acquiring training sample set for small target pedestrian detection and transforming format; initializing training model and preprocessing training samples; extracting shallow and deep features of samples, and fusing the information of deep features into shallow features to form a training sample. Multiscale detection framework; Iterative updating of network parameters; Testing after completion of network training. Based on the SSD algorithm, the present invention introduces a two-stage feature fusion module, which effectively utilizes the context information between the feature layers, enables the deep network information to be better integrated into the shallow network, and strengthens the detection performance of the SSD algorithm for small target pedestrians.

全部详细技术资料下载

【技术实现步骤摘要】
一种加强SSD小目标行人检测性能的网络结构及检测方法
本专利技术涉及深度学习及行人检测领域，特别涉及一种加强SSD小目标行人检测性能的网络结构及检测方法。
技术介绍
行人检测是计算机视觉领域中的一个重要研究分支，主要任务是判断输入的图像或视频序列中是否出现行人，并确定其位置。行人检测技术广泛地应用于视频监控、车辆辅助驾驶、智能机器人等多个领域。近年来，深度学习方法在目标检测上取得了重大的突破，展现出比传统方法更强大的检测能力。行人检测作为一种特定的目标检测任务，也获益于深度学习技术的快速发展。相比于传统的检测方法，深度学习方法可以从训练数据中自主地学习行人的特征，并且可以实现端到端的检测。2014年RossGirshick等人在欧洲计算机视觉会议(ECCV)上发表论文《Richfeaturehierarchiesforaccurateobjectdetectionandsemanticsegmentation》，首次将深度学习引入目标检测领域，相比于传统检测方法，大幅提高了在PASCALVOC数据集上的检测准确率。2016年发表于计算机视觉和模式识别会议(CVPR)上的论文《YouOnlyLookOnce:Unified,Real-TimeObjectDetection》提出了YOLO算法，不需要区域建议过程，可以达到实时检测，但是检测精度偏低。2016年WeiLiu等人在ECCV会议上发表论文《SSD:SingleShotMultiBoxDetector》，所提出的SSD算法也属于无区域建议的方法，利用多尺度检测思想，在提高检测精度的同时满足了实时性。然...

【技术保护点】
1.一种加强SSD小目标行人检测性能的网络结构，其特征在于，包括：预处理模块，用于统一样本尺寸和样本扩增；基础网络模块，用于提取样本的浅层特征；附加特征提取模块，用于提取样本的深层特征；两级特征融合模块，用于将深层特征与浅层特征融合；分类和回归模块，用于计算损失，实现分类和行人框的回归。

【技术特征摘要】
1.一种加强SSD小目标行人检测性能的网络结构，其特征在于，包括：预处理模块，用于统一样本尺寸和样本扩增；基础网络模块，用于提取样本的浅层特征；附加特征提取模块，用于提取样本的深层特征；两级特征融合模块，用于将深层特征与浅层特征融合；分类和回归模块，用于计算损失，实现分类和行人框的回归。2.根据权利要求1所述的网络结构，其特征在于，所述基础网络模块采用VGG16内置网络，其Conv4_3作为浅层特征提取层；所述附加特征提取模块，其Fc7、Conv6_2、Conv7_2、Conv8_2、Conv9_2作为深层特征提取层；所述两级特征融合模块，用于将Fc7、Conv6_2、Conv7_2、Conv8_2、Conv9_2的特征信息融合到Conv4_3中；第一级融合，先将Conv4_3经过3×3卷积并以ReLU方式激活，再将Fc7、Conv6_2、Conv7_2、Conv8_2、Conv9_2分别经过3×3卷积、ReLU方式激活以及双线性插值操作，使其与Conv4_3尺度一致；然后将经过卷积、激活和插值操作的五个特征提取层分别与经过卷积、激活操作的Conv4_3按照Eltwise-SUM方式融合在一起，即将特征图对应位置单元进行相加，得到五个融合层；最后，将每一个融合层再次以ReLU方式激活，并进行BatchNorm操作；第二级融合，将所得的五个融合特征层按照Eltwise-SUM方式融合，即将每个特征图对应位置单元进行相加，得到新的融合层，然后再将新融合层以ReLU方式激活，并进行BatchNorm操作，得到最终的两级特征融合层。3.一种加强SSD小目标行人检测性能的检测方法，其特征在于，包括以下训练步骤：获取用于小目标行人检测的训练样本集，并转化为深度学习框架可以直接读取的格式；初始化训练模型，对训练样本进行预处理；提取样本的浅层特征和深层特征，将深层特征的信息融合到浅层特征中，形成多尺度检测框架；计算损失并反向传播，进行网络参数的迭代更新；完成网络训练。4.根据权利要求3所述的检测方法，其特征在于，所述初始化训练模型过程中设置模型训练参数，包括预训练模型、模型迭代次数、学习率、优化方法、算法训练的batchsize、batchsize个数、分类IOU阈值、初始迭代次数；对训练样本进行预处理包括将样本尺寸统一并采用缩放、翻转、切块的操作对训练样本集进行扩充。5.根据权利要求3所述的检测方法，其特征在于，将经过预处理的样本通过基础网络模块提取浅层特征，通过附加特征提取模块提取深层特征，采用两级特征融合策略，将...

【专利技术属性】
技术研发人员：胡永健，陈奇华，刘琲贝，王宇飞，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人