一种基于超大尺寸高分辨图像的行人目标检测方法及系统技术方案

技术编号:32130998 阅读:31 留言:0更新日期:2022-01-29 19:30
本发明专利技术公开了一种基于超大尺寸高分辨图像的行人目标检测方法及系统,以行人的目标框为中心,采用不同的固定尺寸对训练集的超大尺寸高分辨图像进行多次切图,得到多尺度的训练数据;采用滑动窗口切图法对测试集的超大尺寸高分辨图像进行多次切图,得到测试集的子图,使用多尺度训练数据对目标检测网络进行训练,然后利用目标检测网络对测试集的子图进行检测,获得子图的预检测结果;将子图检测结果的目标框坐标换转为对应原始大图的坐标作为预检测标签,利用预检测标签对数据以行人目标为中心切图,设定多个切图尺寸得到多尺度的子图,得到多尺度的检测结果;使用区域NMS方法对多尺度的检测结果进行融合,得到最终的检测结果。提高了检测准确率。提高了检测准确率。提高了检测准确率。

【技术实现步骤摘要】
一种基于超大尺寸高分辨图像的行人目标检测方法及系统


[0001]本专利技术属于图像识别
,具体涉及一种基于超大尺寸高分辨图像的行人目标检测方法及系统。

技术介绍

[0002]行人检测是计算机视觉研究的热点问题之一,具有广泛的实际应用前景。通常结合行人跟踪、行人识别等技术,应用于智能驾驶辅助系统、智能视频监控、高级人机界面等应用领域。行人检测的目的是确定图像中是否存在行人,如果确实存在行人,则定位并标记行人的位置,以获取行人的位置和动作等信息。
[0003]而特征提取是行人检测的重要组成部分,主要包括基于手工制作的特征(如面向梯度直方图(HOG)结合支持向量机(SVM))和基于卷积神经网络(CNN)的方法。由于CNN学习判别特征的能力较强,基于CNN的方法在这一领域占主导地位,并且在公共基准上的结果显著提高。
[0004]但是,由于受行人外观相似、距离摄像机的距离、能见度条件等因素的影响,导致目前的行人检测算法在更复杂的场景下鲁棒性较差,在行人检测的过程中会出现错检,漏检的情况。其中一个具有挑战性的任务是宽视场监控视频的行人本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于超大尺寸高分辨图像的行人目标检测方法,其特征在于,包括以下步骤:S1、以行人的目标框为中心,采用不同的固定尺寸对训练集的超大尺寸高分辨图像进行多次切图,得到多尺度的训练数据;S2、采用滑动窗口切图法对测试集的超大尺寸高分辨图像进行多次切图,得到测试集的子图,使用步骤S1得到的多尺度训练数据对目标检测网络进行训练,然后利用目标检测网络对测试集的子图进行检测,获得子图的预检测结果;S3、将步骤S2获得的子图检测结果的目标框坐标换转为对应原始大图的坐标作为预检测标签,利用预检测标签对数据以行人目标为中心切图,设定多个切图尺寸得到多尺度的子图,得到多尺度的检测结果;S4、使用区域NMS方法对步骤S3获得的多尺度的检测结果进行融合,得到最终的检测结果。2.根据权利要求1所述的方法,其特征在于,步骤S1中,对每一张训练集原始图,以一个目标框为中心固定尺寸大小确定子图的左上角及右下角坐标并进行裁剪,保留子图内部完整的目标框,对于不完整被截断的目标,判断中心是否在区域内,在区域内则保留框并将越界的框限制到图像区域内;然后对目标框坐标进行变换转为子图坐标作为子图标签,标记中保留的完整边界框;随后以没有标记过的目标框为中心进行切图。3.根据权利要求2所述的方法,其特征在于,训练数据切图的尺寸为(2500,2500)及(5000,5000)。4.根据权利要求1所述的方法,其特征在于,步骤S2具体为:对每一张测试集大图,使用固定尺寸的窗口从原始图左上角开始以一定的步长从上到下从左到右进行滑动切图,使用尺寸(5000,5000)的滑动窗口,对测试集进行切图,得到测试集的子图。5.根据权利要求4所述的方法,其特征在于,滑动窗口的步长设置为窗口的一半大小。6.根据权利要求1所述的方法,其特征在于,步骤S3中,根据预检测结果对从测试集超大尺寸高分辨图像以行人为中心进行固定尺寸切图,保留子图...

【专利技术属性】
技术研发人员:李玲玲郭晓惠耿雪莉马晶晶焦李成刘芳梁普江刘旭张梦璇张丹吴文童陈牧
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1