一种基于视频图像的人体目标检测方法及系统技术方案

技术编号:23315860 阅读:111 留言:0更新日期:2020-02-11 18:04
本发明专利技术公开一种基于视频图像的人体目标检测方法及系统。该方法包括:获取带有标注信息的视频图像人体目标数据集;采用迁移学习算法,提取TINY YOLOv3模型的部分网络层,得到预训练模型;采用带有标注信息的视频图像人体目标数据集和预训练模型,对TINY YOLOv3模型进行训练,得到训练好的人体目标检测模型;将人体目标检测模型部署至树莓派设备;获取待检测的视频图像;将待检测的视频图像输入至树莓派设备中的人体目标检测模型,对待检测的视频图像中的人体目标进行检测。本发明专利技术可以改善嵌入式设备在视频图像人体目标检测中出现的漏检、误检、遮挡等现象,提高行人目标检测的位置精度,满足实时性的要求。

A method and system of human target detection based on video image

【技术实现步骤摘要】
一种基于视频图像的人体目标检测方法及系统
本专利技术涉及图像处理领域,特别是涉及一种基于视频图像的人体目标检测方法及系统。
技术介绍
传统的目标检测方法包括三个步骤:区域选择、特征提取和分类回归。基于深度学习的目标检测方法改善了传统检测算法的适应性不高、对背景模型的更新要求高、提取特征鲁棒性差和检测的实时性差等缺点,使检测模型在精度和速度方面都有了极大的提升。但是,现有的检测方法集成于嵌入式设备进行视频图像人体目标检测时,会出现漏检、误检、遮挡等现象,导致检测结果准确度低。
技术实现思路
本专利技术的目的是提供一种基于视频图像的人体目标检测方法及系统,以提高人体目标检测的准确度。为实现上述目的,本专利技术提供了如下方案:一种基于视频图像的人体目标检测方法,包括:获取带有标注信息的视频图像人体目标数据集;采用迁移学习算法,提取TINYYOLOv3模型的部分网络层,得到预训练模型;采用所述带有标注信息的视频图像人体目标数据集和所述预训练模型,对所述TINYYOLOv3模型进行训练,得到训练好的人体目标检测模型;将所述人体目标检测模型部署至树莓派设备;获取待检测的视频图像;将所述待检测的视频图像输入至所述树莓派设备中的所述人体目标检测模型,对所述待检测的视频图像中的人体目标进行检测。可选的,所述获取带有标注信息的视频图像人体目标数据集,具体包括:在PASCALVOC标准目标检测数据集中选取多张包含人体目标的图片,得到第一数据集;从网上抓取多张包含人体目标的图片,采用LabelImg软件进行手动标注对所述包含人体目标的图片进行补充,得到第二数据集;将所述第一数据集和所述第二数据集合并,得到所述带有标注信息的视频图像人体目标数据集。可选的,所述采用迁移学习算法,提取TINYYOLOv3模型的部分网络层,得到预训练模型,之前还包括:对所述TINYYOLOv3模型的先验检测框进行重新测算,使用K-Means聚类算法生成适用于人体目标检测的多组先验检测框。可选的,所述将所述人体目标检测模型部署至树莓派设备,具体包括:将darknet框架支持的所述人体目标检测模型转换为Tensorflow框架支持的.pb模型;将所述.pb模型转化为Movidius框架支持的IR模型;将所述IR模型部署至树莓派设备。可选的,还包括:在将所述待检测的视频图像输入至所述树莓派设备中的所述人体目标检测模型,对所述待检测的视频图像中的人体目标进行检测过程中,使用IntelMovidius神经计算棒对检测过程进行加速。本专利技术还提供一种基于视频图像的人体目标检测系统,包括:视频图像人体目标数据集获取模块,用于获取带有标注信息的视频图像人体目标数据集;预训练模型获取模块,用于采用迁移学习算法,提取TINYYOLOv3模型的部分网络层,得到预训练模型;训练模块,用于采用所述带有标注信息的视频图像人体目标数据集和所述预训练模型,对所述TINYYOLOv3模型进行训练,得到训练好的人体目标检测模型;部署模块,用于将所述人体目标检测模型部署至树莓派设备;待检测的视频图像获取模块,用于获取待检测的视频图像;检测模块,用于将所述待检测的视频图像输入至所述树莓派设备中的所述人体目标检测模型,对所述待检测的视频图像中的人体目标进行检测。可选的,所述视频图像人体目标数据集获取模块具体包括:第一数据集获取单元,用于在PASCALVOC标准目标检测数据集中选取多张包含人体目标的图片,得到第一数据集;第二数据集获取单元,用于从网上抓取多张包含人体目标的图片,采用LabelImg软件进行手动标注对所述包含人体目标的图片进行补充,得到第二数据集;合并单元,用于将所述第一数据集和所述第二数据集合并,得到所述带有标注信息的视频图像人体目标数据集。可选的,还包括:先验检测框获取模块,用于在所述采用迁移学习算法,提取TINYYOLOv3模型的部分网络层,得到预训练模型之前,对所述TINYYOLOv3模型的先验检测框进行重新测算,使用K-Means聚类算法生成适用于人体目标检测的多组先验检测框。可选的,所述部署模块具体包括:第一转换单元,用于将darknet框架支持的所述人体目标检测模型转换为Tensorflow框架支持的.pb模型;第二转换单元,用于将所述.pb模型转化为Movidius框架支持的IR模型;部署单元,用于将所述IR模型部署至树莓派设备。可选的,还包括:加速模块,用于在将所述待检测的视频图像输入至所述树莓派设备中的所述人体目标检测模型,对所述待检测的视频图像中的人体目标进行检测过程中,使用IntelMovidius神经计算棒对检测过程进行加速。根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果:本专利技术将现有模型的一部分网络层次提取出来作为预训练模型,加快训练速度;将训练后的人体目标检测模型部署在树莓派移动控制设备上,再利用IntelMovidius神经计算棒进行推理加速,提高了检测算法的时间效率,最终实现了实时人体目标智能识别,警告非法入侵,实时视频直播等功能。在具体实施时,利用K-Means聚类算法对目标检测深度学习框架TINYYOLOv3的anchor值重新测算,使其更适合于嵌入式设备环境下的人体目标检测,可以进一步提高检测精度。本专利技术可以提高嵌入式设备人体目标检测过程中检测的位置精度和检测速度,在不同距离层次场景、多目标遮挡场景、单目标场景和逆光场景下都能得到较好的检测效果。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术基于视频图像的人体目标检测方法的流程示意图;图2为本专利技术基于视频图像的人体目标检测方法中采用LabelImg软件进行手动标注得到的第二数据集;图3为本专利技术基于视频图像的人体目标检测方法中采用K-Means聚类算法生成多组先验检测框的示意图;图4为本专利技术基于视频图像的人体目标检测方法中训练过程的LOSS和IOU曲线图;其中,(a)部分为LOSS曲线图,(b)部分为IOU曲线图;图5为本专利技术基于视频图像的人体目标检测方法的检测结果;图6为本专利技术基于视频图像的人体目标检测系统的结构示意图;图7为本专利技术基于视频图像的人体目标检测系统的总体结构图;图8为本专利技术基于视频图像的人体目标检测系统的硬件结构图;图9为本专利技术基于视频图像的人体目标检测系统的控制软件流程图;图10为本专利技术基于视频图像的人体目标检测系统的控制端web页面截图;图11为本专利技术视频图像人本文档来自技高网...

【技术保护点】
1.一种基于视频图像的人体目标检测方法,其特征在于,包括:/n获取带有标注信息的视频图像人体目标数据集;/n采用迁移学习算法,提取TINYYOLOv3模型的部分网络层,得到预训练模型;/n采用所述带有标注信息的视频图像人体目标数据集和所述预训练模型,对所述TINYYOLOv3模型进行训练,得到训练好的人体目标检测模型;/n将所述人体目标检测模型部署至树莓派设备;/n获取待检测的视频图像;/n将所述待检测的视频图像输入至所述树莓派设备中的所述人体目标检测模型,对所述待检测的视频图像中的人体目标进行检测。/n

【技术特征摘要】
1.一种基于视频图像的人体目标检测方法,其特征在于,包括:
获取带有标注信息的视频图像人体目标数据集;
采用迁移学习算法,提取TINYYOLOv3模型的部分网络层,得到预训练模型;
采用所述带有标注信息的视频图像人体目标数据集和所述预训练模型,对所述TINYYOLOv3模型进行训练,得到训练好的人体目标检测模型;
将所述人体目标检测模型部署至树莓派设备;
获取待检测的视频图像;
将所述待检测的视频图像输入至所述树莓派设备中的所述人体目标检测模型,对所述待检测的视频图像中的人体目标进行检测。


2.根据权利要求1所述的基于视频图像的人体目标检测方法,其特征在于,所述获取带有标注信息的视频图像人体目标数据集,具体包括:
在PASCALVOC标准目标检测数据集中选取多张包含人体目标的图片,得到第一数据集;
从网上抓取多张包含人体目标的图片,采用LabelImg软件进行手动标注对所述包含人体目标的图片进行补充,得到第二数据集;
将所述第一数据集和所述第二数据集合并,得到所述带有标注信息的视频图像人体目标数据集。


3.根据权利要求1所述的基于视频图像的人体目标检测方法,其特征在于,所述采用迁移学习算法,提取TINYYOLOv3模型的部分网络层,得到预训练模型,之前还包括:
对所述TINYYOLOv3模型的先验检测框进行重新测算,使用K-Means聚类算法生成适用于人体目标检测的多组先验检测框。


4.根据权利要求1所述的基于视频图像的人体目标检测方法,其特征在于,所述将所述人体目标检测模型部署至树莓派设备,具体包括:
将darknet框架支持的所述人体目标检测模型转换为Tensorflow框架支持的.pb模型;
将所述.pb模型转化为Movidius框架支持的IR模型;
将所述IR模型部署至树莓派设备。


5.根据权利要求1所述的基于视频图像的人体目标检测方法,其特征在于,还包括:
在将所述待检测的视频图像输入至所述树莓派设备中的所述人体目标检测模型,对所述待检测的视频图像中的人体目标进行检测过程中,使用IntelMovidius神经计算棒对检测过程进行加速。


6.一种基于视频图像的人体目标检测系统,其特征在于,包括:
视频图像人体目标数据集获取模块,用于获取带...

【专利技术属性】
技术研发人员:党建武金静王松王阳萍张振海雍玖杨景玉闵永智林俊亭岳彪
申请(专利权)人:兰州交通大学兰州博才科技有限公司
类型:发明
国别省市:甘肃;62

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1