基于深度神经网络的行人步态分割方法技术

技术编号：23984876 阅读：22 留言：0更新日期：2020-04-29 13:02

本发明专利技术针对行人步态分割时对双腿间的“O型”形状难以分割以及腿型分割不够精细的问题，提出一种基于深度神经网络的行人步态分割方法。本发明专利技术通过设计空洞卷积残差卷积网络和添加边缘检测器分支两步实现对行人步态的精细分割；利用空洞卷积替换resnet最后阶段的普通卷积来提高浅层网络的感受野，得到更多信息的特征传入到下个阶段，最后得到的mask再输入至由边缘检测算子组成的边缘检测器中，很好地解决了行人步态中步态边缘不拟合的问题，从而得到更加精确的行人步态边缘，提高了腿部分割的精细度。

Pedestrian gait segmentation based on depth neural network

全部详细技术资料下载

【技术实现步骤摘要】
基于深度神经网络的行人步态分割方法
本专利技术涉及计算机视觉中图像处理和模式识别
，具体涉及一种基于深度神经网络的行人步态分割方法。
技术介绍
近年来，视频监控广泛地运用在交通、军事、城市建设、安全等领域，其重要性越来越不可忽视。行人的步态分割是视频监控技术中不可或缺的一部分。从行人步态的图像视频中提取行人区域是行人步态识别的一个重要环节，也是最苛刻的计算机视觉任务之一。目前，针对行人步态分割的研究较少，而对实例分割的研究相对更加成熟。实例分割是一种基本的计算机视觉技术，是从图像处理到图像分析的关键步骤，是进行图像分析的第一步工作，也是最苛刻的计算机视觉任务之一，它涉及了目标定位和分割对象实例。近年来大量的实例分割论文的发表，提供了大量的实例分割的方法，这为行人步态分割提供了良好的技术基础。
技术实现思路
本专利技术的目的是提供一种基于深度神经网络的行人步态分割方法。为了达到上述目的，本专利技术通过以下技术方案来实现：基于深度神经网络的行人步态分割方法，其特征在于包括如下步骤：S1）预测行人的步态边界在给定一个图片或视频的情况下，预测图片或视频中1个或多个行人的步态边界；对于图片，检测单一图片中所有行人的目标，对目标进行步态分割；对于视频，输入每一帧，检测视频每一帧中所有行人的目标，对目标进行步态分割，输出处理后的每一帧并组合成为一个分割好的行人步态视频；S2）图像预处理和制作标签将分割好的行人步态图像的大小统一...

【技术保护点】
1.基于深度神经网络的行人步态分割方法，其特征在于包括如下步骤：/nS1）预测行人的步态边界/n在给定一个图片或视频的情况下，预测图片或视频中1个或多个行人的步态边界；/n对于图片，检测单一图片中所有行人的目标，对目标进行步态分割；/n对于视频，输入每一帧，检测视频每一帧中所有行人的目标，对目标进行步态分割，输出处理后的每一帧并组合成为一个分割好的行人步态视频；/nS2）图像预处理和制作标签/n将分割好的行人步态图像的大小统一调整为h*w，其中，h为图像的高，w为图像的宽；/n制作标签，对图像相同位置的目标进行像素值处理，将行人的位置采用像素值为14的像素描边，非行人位置统一设置像素值为0，表示背景；/nS3）构建步态分割深度卷积神经网络/nS3-1）采用基础网络进行特征提取/n采用resnet50网络作为基础网络，在resnet50网络结构上，利用空洞率为2的空洞卷积替换resnet50最后一个阶段的普通卷积；/nS3-2）将步骤S2）预处理的图像输入至步骤S3-1）的基础网络中，图像经过基础网络后输入至FPN进一步提取各维度的特征，利用FPN从下至上各个层对同一scale图片不同维...

【技术特征摘要】
1.基于深度神经网络的行人步态分割方法，其特征在于包括如下步骤：
S1）预测行人的步态边界
在给定一个图片或视频的情况下，预测图片或视频中1个或多个行人的步态边界；
对于图片，检测单一图片中所有行人的目标，对目标进行步态分割；
对于视频，输入每一帧，检测视频每一帧中所有行人的目标，对目标进行步态分割，输出处理后的每一帧并组合成为一个分割好的行人步态视频；
S2）图像预处理和制作标签
将分割好的行人步态图像的大小统一调整为h*w，其中，h为图像的高，w为图像的宽；
制作标签，对图像相同位置的目标进行像素值处理，将行人的位置采用像素值为14的像素描边，非行人位置统一设置像素值为0，表示背景；
S3）构建步态分割深度卷积神经网络
S3-1）采用基础网络进行特征提取
采用resnet50网络作为基础网络，在resnet50网络结构上，利用空洞率为2的空洞卷积替换resnet50最后一个阶段的普通卷积；
S3-2）将步骤S2）预处理的图像输入至步骤S3-1）的基础网络中，图像经过基础网络后输入至FPN进一步提取各维度的特征，利用FPN从下至上各个层对同一scale图片不同维度的特征表达结构，有效生成对图片的多维度特征表达的方法；
S3-3）将步骤S3-2）中提取到的特征再通过ROIAlign生成14*14*256大小的ROIfeatures，通过ROIAlign生成候选框regionproposal映射产生固定大小的featuremap，通过采用双线性插值法获得更加准确的行人候选框；
S3-4）将步骤S3-3）中14*14*256大小的featuremap经过5个卷积后再经过反卷积变换为28*28...

【专利技术属性】
技术研发人员：王慧燕，雷蕾，
申请(专利权)人：浙江工商大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人