【技术实现步骤摘要】
一种基于多尺度的行人检测方法
本专利技术涉及计算机视觉图像处理领域,特别是一种基于多尺度的行人检测方法。
技术介绍
近年来,计算机视觉技术在深度学习的支持下取得了飞速的发展,吸引了众多研究者投身其中。成千上万的科研人员尽管关注的焦点各不相同,但是最终的目标是一样的:让技术为人服务,或者说解放生产力,或者说提高生活质量。既然技术是为人服务的,因此与“人”相关的研究就显得不可或缺。无论是在学术界还是产业界,与“人”相关的研究都起着主导作用。行人检测作为人类行为分析、步态识别、智能视频监控和自动驾驶等许多现实任务的第一步和最基本的一步,在过去的十几年中受到了广泛的关注。然而,尽管深度卷积神经网络(deepconvolutionalneuralnetworks,CNNs)在通用目标检测方面已经取得了很大的进展,得到了较好的效果,但是通用目标检测的重要分支之一的行人检测,却是一个长期以来难以解决的问题。从重要性来讲,行人检测是行人追踪、自动驾驶、安防监控等任务的前提。虽然只有“人”这一单一类别,但我们仍然面临很多挑战,比如检测 ...
【技术保护点】
1.一种基于多尺度的行人检测方法,其特征在于,包括以下步骤:/n步骤1、获得行人数据集,行人数据集包括CityPersons行人数据集和Caltech行人数据集;/n步骤2、搭建行人检测模型,行人检测模块包括多尺度特征融合模型和RPN网络,行人检测模型具体如下:/n(1)构建多尺度特征融合模型,构建过程具体如下:/n将行人数据集输入至第一部分卷积网络,第一部分卷积网络、第二部分卷积网络、第三部分卷积网络、第四部分卷积网络和第五部分卷积网络是依次顺序连接的,其中,/n第一部分卷积网络,用于提取行人数据集的特征图fm1并将其输出至第二部分卷积网络;/n第二部分卷积网络,用于再次 ...
【技术特征摘要】
1.一种基于多尺度的行人检测方法,其特征在于,包括以下步骤:
步骤1、获得行人数据集,行人数据集包括CityPersons行人数据集和Caltech行人数据集;
步骤2、搭建行人检测模型,行人检测模块包括多尺度特征融合模型和RPN网络,行人检测模型具体如下:
(1)构建多尺度特征融合模型,构建过程具体如下:
将行人数据集输入至第一部分卷积网络,第一部分卷积网络、第二部分卷积网络、第三部分卷积网络、第四部分卷积网络和第五部分卷积网络是依次顺序连接的,其中,
第一部分卷积网络,用于提取行人数据集的特征图fm1并将其输出至第二部分卷积网络;
第二部分卷积网络,用于再次提取行人数据集的特征图fm2,并将特征图fm2输出至第三部分卷积网络;
第三部分卷积网络,用于对特征图fm2进行3个3×3的卷积层运算以及1个2×2的最大池化层处理,得到特征图fm3输入至第四部分卷积网络;
第四部分卷积网络,用于对fm3进行3个3×3的卷积层运算以及1个2×2的最大池化层处理,得到特征图fm4输入至第四层卷积网络;
第五部分卷积网络,用于对fm4进行3个3×3的卷积层运算以及1个2×2的最大池化层处理,得到特征图fm5;
将第五部分卷积网络得到的输出fm5先经过1×1卷积,改变fm5的通道数,得到的输出记为M5;
将M5通过2倍上采样,得到上采样后的M5;将fm4经过1×1卷积后得到的特征图与上采样后的M5相加,得到的结果记为M4;
M4通过2倍上采样,得到上采样后的M4;将fm3经过1×1卷积后得到的特征图与上采样后的M4相加,得到的结果记为M3;
将得到的M3通过4倍下采样得到的结果记为m3、M4通过2倍下采样得到的结果记为m4;
最后将m3、m4和M5相加输出结果特征图送入RPN网络;
(2)RPN网络用于通过多尺度感受的野滑窗生成候选区域;具体如下:
RPN网络,用于采用5种不同大小的滑动窗口来生成候选区域,分别通过1×1、3×3、5×5、7×7和9×9卷积实现,最后再将得到的不同感受野大小的候选区域形成的结果进行合并;
步骤3、在行人检测模型构建好的基础上,将行人数据集输入至行人检测模型中,具体方案如下:使用CityPersons行人数据集对搭建好的行人检测模型进行预训练,...
【专利技术属性】
技术研发人员:任健,邵文泽,李海波,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。