基于深度学习的运动目标检测方法及装置制造方法及图纸

技术编号:19826001 阅读:48 留言:0更新日期:2018-12-19 16:15
本发明专利技术提供了基于深度学习的运动目标检测方法,该方法包括:输入或者采集视频图像;对视频图像进行运动目标检测,获取前景区域;对前景区域进行外扩处理,获取外扩前景区域的位置及对应的子图像;将子图像等比例缩放到固定高度,并对缩放后的子图像进行横向拼接,获取横向拼接子图像;采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框,将视频图像内目标检测框映射的区域作为目标检测区域,并输出。与现有技术相比,本发明专利技术能快速地进行运动目标检测,且检测准确率高。

【技术实现步骤摘要】
基于深度学习的运动目标检测方法及装置
本专利技术涉及图像处理、视频监控,特别涉及基于深度学习的运动目标检测方法及装置。
技术介绍
目标检测是指计算机和软件系统在图像/场景中定位并识别出每个目标的能力,已广泛应用于人脸检测、车辆检测、行人计数、网络图像、安全系统和无人驾驶汽车等领域。传统的运动目标检测方法一般采用帧差法或背景减法,但这些传统的运动目标检测方法容易受光线、环境等的影响,检测的准确率较低。近年来,基于深度学习的检测方法(例如SSD、Yolo、FasterRCNN等)对多目标具备很好的检测效果,但是为了解决多目标检测较为宽泛尺寸的问题,往往需要较大的计算量。综上所述,目前迫切需要提出一种检测较快的基于深度学习的运动目标检测方法。
技术实现思路
有鉴于此,本专利技术的主要目的在于快速实现运动目标检测,且检测准确率较高。为达到上述目的,按照本专利技术的第一个方面,提供了基于深度学习的运动目标检测方法,该方法包括:第一步骤,输入或者采集视频图像;第二步骤,对视频图像进行运动目标检测,获取前景区域;第三步骤,对前景区域进行外扩处理,获取外扩前景区域的位置及对应的子图像;第四步骤,将子图像等比例缩放到固定高度,并对缩放后的子图像进行横向拼接,获取横向拼接子图像;第五步骤,采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框,将视频图像内目标检测框映射的区域作为目标检测区域,并输出。进一步地,所述第三步骤包括:计算当前帧图像中第i个前景区域的宽度wi和高度hi,则第i个前景区域外扩处理后,获取的第i个外扩前景区域的宽度为wi′=αwi、高度为hi′=αhi、左上角横坐标为左上角纵坐标为其中xi、yi为第i个前景区域的横坐标和纵坐标;根据第i个外扩前景区域的宽度wi′、高度hi′和左上角位置的坐标(xi′,yi′),从当前帧图像中获取对应位置的矩形区域图像作为第i个子图像。进一步地,所述第四步骤包括:固定高度等比例缩放步骤,计算当前帧图像中第i个子图像的缩放比例按照缩放比例βi,对第i个子图像进行缩放,获取第i个缩放子图像,其中H为固定高度,hi′为子图像的高度;横向拼接步骤,将当前帧图像中所有缩放子图像进行横向拼接,获取当前帧图像的横向拼接子图像,横向拼接子图像的高度为H、宽度为所有缩放子图像的宽度和。进一步地,所述第五步骤包括:目标检测框获取步骤,采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框;目标检测框映射步骤,根据目标检测框获取对应的缩放子图像为第i个缩放子图像,统计第i个缩放子图像内目标检测框的宽度Δwi、高度Δhi、左上角坐标(Δxi,Δyi),并根据第i个缩放子图像的缩放比例βi,获取第i个子图像内的目标检测区域的宽度为高度为左上角坐标为其中(xi′,yi′)为第i个子图像的左上角坐标;目标检测区域输出步骤,输出所有子图像内的目标检测区域。按照本专利技术的另一个方面,提供了基于深度学习的运动目标检测装置,该装置包括:视频图像输入或采集模块,用于输入或者采集视频图像;运动目标检测模块,用于对视频图像进行运动目标检测,获取前景区域;外扩处理及子图像获取模块,用于对前景区域进行外扩处理,获取外扩前景区域的位置及对应的子图像;横向拼接子图像获取模块,用于将子图像等比例缩放到固定高度,并对缩放后的子图像进行横向拼接,获取横向拼接子图像;目标检测框和映射模块,用于采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框,将视频图像内目标检测框映射的区域作为目标检测区域,并输出。进一步地,所述外扩处理及子图像获取模块包括:用于计算当前帧图像中第i个前景区域的宽度wi和高度hi,则第i个前景区域外扩处理后,获取的第i个外扩前景区域的宽度为wi′=αwi、高度为hi′=αhi、左上角横坐标为左上角纵坐标为其中xi、yi为第i个前景区域的横坐标和纵坐标;根据第i个外扩前景区域的宽度wi′、高度hi′和左上角位置的坐标(xi′,yi′),从当前帧图像中获取对应位置的矩形区域图像作为第i个子图像。进一步地,所述横向拼接子图像获取模块包括:固定高度等比例缩放模块,用于计算当前帧图像中第i个子图像的缩放比例按照缩放比例βi,对第i个子图像进行缩放,获取第i个缩放子图像,其中H为固定高度,hi′为子图像的高度;横向拼接模块,用于将当前帧图像中所有缩放子图像进行横向拼接,获取当前帧图像的横向拼接子图像,横向拼接子图像的高度为H、宽度为所有缩放子图像的宽度和。进一步地,所述目标检测框和映射模块包括:目标检测框获取模块,用于采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框;目标检测框映射模块,用于根据目标检测框获取对应的缩放子图像为第i个缩放子图像,统计第i个缩放子图像内目标检测框的宽度Δwi、高度Δhi、左上角坐标(Δxi,Δyi),并根据第i个缩放子图像的缩放比例βi,获取第i个子图像内的目标检测区域的宽度为高度为左上角坐标为其中(xi′,yi′)为第i个子图像的左上角坐标;目标检测区域输出模块,用于输出所有子图像内的目标检测区域。与现有的运动目标检测技术相比,本专利技术的基于深度学习的运动目标检测方法及装置采用运动目标检测、外扩处理、固定高度缩放、横向拼接、以及深度学习目标检测模型等方法,在提高目标检测准确率的同时,有效地降低了目标检测的复杂度和算法需求。附图说明图1示出了按照本专利技术的基于深度学习的运动目标检测方法的流程图。图2示出了按照本专利技术的基于深度学习的运动目标检测装置的框架图。具体实施方式为使本领域的技术人员能进一步了解本专利技术的结构、特征及其他目的,现结合所附较佳实施例详细说明如下,所说明的较佳实施例仅用于说明本专利技术的技术方案,并非限定本专利技术。图1给出了按照本专利技术的基于深度学习的运动目标检测方法的流程图。如图1所示,按照本专利技术的基于深度学习的运动目标检测方法包括:第一步骤S1,输入或者采集视频图像;第二步骤S2,对视频图像进行运动目标检测,获取前景区域;第三步骤S3,对前景区域进行外扩处理,获取外扩前景区域的位置及对应的子图像;第四步骤S4,将子图像等比例缩放到固定高度,并对缩放后的子图像进行横向拼接,获取横向拼接子图像;第五步骤S5,采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框,将视频图像内目标检测框映射的区域作为目标检测区域,并输出。所述第二步骤S2中运动目标检测可以采用现有的运动目标检测或者移动目标检测方法实现,包括但不限于以下一种或者多种方法的组合:基于背景建模的运动目标检测、基于帧差法的运动目标检测、基于光流法的运动目标检测等。示例性地,采用基于混合高斯背景建模的运动目标检测方法,从视频图像中获取一个或者多个前景区域。进一步地,所述第三步骤S3包括:计算当前帧图像中第i个前景区域的宽度wi和高度hi,则第i个前景区域外扩处理后,获取的第i个外扩前景区域的宽度为wi′=αwi、高度为hi′=αhi、左上角横坐标为左上角纵坐标为其中xi、yi为第i个前景区域的横坐标和纵坐标;根据第i个外扩前景区域的宽度wi′、高度hi′和左上角位置的坐标(xi′,yi′),从当前帧图像中获取对应位置的矩形区域图像本文档来自技高网...

【技术保护点】
1.基于深度学习的运动目标检测方法,其特征在于,该方法包括:第一步骤,输入或者采集视频图像;第二步骤,对视频图像进行运动目标检测,获取前景区域;第三步骤,对前景区域进行外扩处理,获取外扩前景区域的位置及对应的子图像;第四步骤,将子图像等比例缩放到固定高度,并对缩放后的子图像进行横向拼接,获取横向拼接子图像;第五步骤,采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框,将视频图像内目标检测框映射的区域作为目标检测区域,并输出。

【技术特征摘要】
1.基于深度学习的运动目标检测方法,其特征在于,该方法包括:第一步骤,输入或者采集视频图像;第二步骤,对视频图像进行运动目标检测,获取前景区域;第三步骤,对前景区域进行外扩处理,获取外扩前景区域的位置及对应的子图像;第四步骤,将子图像等比例缩放到固定高度,并对缩放后的子图像进行横向拼接,获取横向拼接子图像;第五步骤,采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框,将视频图像内目标检测框映射的区域作为目标检测区域,并输出。2.如权利要求1所述的方法,其特征在于,所述第三步骤包括:计算当前帧图像中第i个前景区域的宽度wi和高度hi,则第i个前景区域外扩处理后,获取的第i个外扩前景区域的宽度为wi′=αwi、高度为hi′=αhi、左上角横坐标为左上角纵坐标为其中xi、yi为第i个前景区域的横坐标和纵坐标;根据第i个外扩前景区域的宽度wi′、高度hi′和左上角位置的坐标(xi′,yi′),从当前帧图像中获取对应位置的矩形区域图像作为第i个子图像。3.如权利要求2所述的方法,进一步地,所述α的取值范围1.04~2.16。4.如权利要求1所述的方法,其特征在于,所述第四步骤包括:固定高度等比例缩放步骤,计算当前帧图像中第i个子图像的缩放比例按照缩放比例βi,对第i个子图像进行缩放,获取第i个缩放子图像,其中H为固定高度,hi′为子图像的高度;横向拼接步骤,将当前帧图像中所有缩放子图像进行横向拼接,获取当前帧图像的横向拼接子图像,横向拼接子图像的高度为H、宽度为所有缩放子图像的宽度和;其中所述固定高度为H=λh,所述h为所述目标深度学习模型的最优检测尺度。5.如权利要求4所述的方法,进一步地,所述λ的取值范围为1.3~1.8,所述最优检测尺度h的取值范围为60~100。6.如权利要求1所述的方法,其特征在于,所述第五步骤包括:目标检测框获取步骤,采用经训练的深度学习目标检测模型对横向拼接图像进行目标检测,获取目标检测框;目标检测框映射步骤,根据目标检测框获取对应的缩放子图像为第i个缩放子图像,统计第i个缩放子图像内目标检测框的宽度Δwi、高度Δhi、左上角坐标(Δxi,Δyi),并根据第i个缩放子图像的缩放比例βi,获取第i个子图像内的目标检测区域的宽度为高度为左上角坐标为其中(xi′,yi′)为第i个子图像的左上角坐标;目标检测区域输出步骤,输出所有子图像内的目标检测区域。7.如权利要求6所述的方法,所述经训练的深度学习检测模型为:根据已标...

【专利技术属性】
技术研发人员:余旭赵雪鹏李党李志国朱明潘晓瞳
申请(专利权)人:北京智芯原动科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1