一种基于神经网络多尺度特征图的行人检测方法技术

技术编号：18166142 阅读：26 留言：0更新日期：2018-06-09 11:51

本发明专利技术公开了一种基于神经网络多尺度特征图的行人检测方法，检测方法为：收集行人检测样本；对选取的视频进行截帧处理，仅保留含有行人的图片；制作样本标签；搭建轻量化残差特征提取网络；搭建多尺度特征图行人检测网络；对搭建的特征提取网络在样本数据集进行网络预训练；将训练好的特征提取网络与搭建的检测网络进行拼接，使用准备好的行人训练数据集进行最终的网络训练。本发明专利技术的有益效果是：本发明专利技术的检测方法是将残差网络作为特征提取网络，并与多尺度特征图行人检测网络进行拼接，能够在场景复杂、行人尺度变化大情况下进行检测，且准确率高、检测效率高等优势。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于神经网络多尺度特征图的行人检测方法
本专利技术涉及图像识别
，特别涉及一基于神经网络多尺度特征图的行人检测方法。
技术介绍
随着经济的发展，科技的进步，人们越来越希望计算机具有智能化，使其能够相比人类更有效、准确的处理问题。在计算机智能化的领域中，计算机视觉的智能化是很重要的一个部分。如今汽车自动驾驶、无人商店、机器人自动化等应用都与计算机视觉智能化息息相关，智能化目标检测技术是这些应用需解决的核心问题之一。目前，传统的行人检测方法，通过提取HOG、LBP、Haar等特征来训练分类器，得到的模型对姿态变化小的行人有着较好的检测率，但是鲁棒性不高。
技术实现思路
为了能够大幅提高在场景复杂、行人尺度变化大情况下的行人检测效率，本专利技术提供了一种能够在复杂场景等情况下进行行人检测且准确率高、检测效率高的基于神经网络多尺度特征图的行人检测方法。为了实现上述专利技术目的，本专利技术提供了一种基于神经网络多尺度特征图的行人检测方法，所述检测方法为：步骤S1：收集行人检测样本；对选取的视频进行截帧处理，对含有行人的图片保留并构成行人检测数据集，不含行人的图片丢弃；其中，所选的视频为多种实时场景监控视频，且视频需要不同分辨率，防止训练时网络过拟合；步骤S2：制作样本标签，对行人检测数据集中一张图片中的每一个行人目标的坐标保存到xml格式的标签文件；步骤S3：搭建轻量化残差特征提取网络；步骤S4：搭建多尺度特征图行人检测网络；步骤S5：对步骤S3搭建的特征提取网络在imagenet数据集进行网络预训练；步骤S6：将步骤S5训练好的特征提取网络与步骤S4搭建的检...
一种基于神经网络多尺度特征图的行人检测方法

【技术保护点】
一种基于神经网络多尺度特征图的行人检测方法，其特征在于，所述检测方法为：步骤S1：收集行人检测样本；对选取的视频进行截帧处理，对含有行人的图片保留并构成行人检测数据集，不含行人的图片丢弃；步骤S2：制作样本标签，对行人检测数据集中一张图片中的每一个行人目标的坐标保存到xml格式的标签文件；步骤S3：搭建轻量化残差特征提取网络；步骤S4：搭建多尺度特征图行人检测网络；步骤S5：对步骤S3搭建的特征提取网络在imagenet数据集进行网络预训练；步骤S6：将步骤S5训练好的特征提取网络与步骤S4搭建的检测网络进行拼接，使用准备好的行人训练数据集进行最终的网络训练。

【技术特征摘要】
1.一种基于神经网络多尺度特征图的行人检测方法，其特征在于，所述检测方法为：步骤S1：收集行人检测样本；对选取的视频进行截帧处理，对含有行人的图片保留并构成行人检测数据集，不含行人的图片丢弃；步骤S2：制作样本标签，对行人检测数据集中一张图片中的每一个行人目标的坐标保存到xml格式的标签文件；步骤S3：搭建轻量化残差特征提取网络；步骤S4：搭建多尺度特征图行人检测网络；步骤S5：对步骤S3搭建的特征提取网络在imagenet数据集进行网络预训练；步骤S6：将步骤S5训练好的特征提取网络与步骤S4搭建的检测网络进行拼接，使用准备好的行人训练数据集进行最终的网络训练。2.根据权利要求1所述的基于神经网络多尺度特征图的行人检测方法，其特征在于，步骤S1中所述的截帧处理，具体为：对每个视频3秒截取一帧并保存为jpg图片格式。3.根据权利要求1或2所述的基于神经网络多尺度特征图的行人检测方法，其特征在于，所述步骤S2中所述的制作样本标签，具体为：将一张图片中每个行人目标左上角、右下角的坐标写入xml文件进行保存，保存xml文件名与图片名一致。4.根据权利要求1-3任一项所述的基于神经网络多尺度特征图的行人检测方法，其特征在于，所述步骤S3中的轻量化残差特征提取网络具体为：将残差网络使用的普通3*3卷积层替换为先使用1*1的卷积层，然后对卷积输出的每一个通道进行3*3的独立卷积，最后将所有3*3的独立卷积层的输出拼接。5.根据权利要求1-4任一项所述的基于神经网络多尺度特征图的行人检测方法，其特征在于，所述步骤S4中，所述多尺度特征行人检测网络，由3个卷积核为3*3卷积层组成，每个卷积层再接两个卷积层；两个卷基层中，其中一个后接smothL1loss进行坐标回归用于预测行人位置，另一个后接softmaxloss进行分类用于判...

【专利技术属性】
技术研发人员：舒泓新，蔡晓东，陈昀，王秀英，贺光明，
申请(专利权)人：中通服公众信息产业股份有限公司，
类型：发明
国别省市：新疆,65

全部详细技术资料下载我是这个专利的主人