一种人体目标识别方法及系统技术方案

技术编号:34558153 阅读:21 留言:0更新日期:2022-08-17 12:44
本发明专利技术提供一种人体目标识别方法系及系统,采用改进的轻量型Yolov5s网络目标检测模型,方法包括以下步骤:实时采集人体目标运动视频,人体目标运动视频中每一帧原始人体目标运动图片输入模型;进行预处理;进行多尺度融合;构建Ciou损失函数Ciou

【技术实现步骤摘要】
一种人体目标识别方法及系统


[0001]本专利技术属于数字图像处理与模式识别
,具体涉及一种人体目标识别方法及系 统。

技术介绍

[0002]近年来视频图像领域加速发展,监控设备上很容易把行人框选出来,但是想获得更多 的人物信息来判断人物行为却较为困难,因为监控中有着环境的干扰、硬件设备算力的不 支持、衡量获取信息的标准不统一等众多因素影响。此外,人体姿态估计与行为判断在生 活场所的各方面得到运用,监控市场需求日益增加。
[0003]现阶段,我国智慧城市与数字经济的提出,为智慧城市未来部署规划,数字经济将会 带动我国经济的大发展。在推进城市智能化的进程中,各个领域的智能硬件产业迅速发展, 城市家庭中涌入了大量的智能化软件或者硬件,例如智能家居、互联网摄像头、交互式智 慧机器人等等,同时众多智能设备中最受人们欢迎的是家庭联网摄像头,因为家庭环境下 摄像头的分辨率不用太高,价格低廉,并且组成家庭监控功能操作步骤简单,一套简便的 室内监控系统只要摄像头,存储硬盘和连接网络就可以。但是其中最核心的技术是机器视 觉,家庭监控设备中的主体往往是人物,先检测了人物状态,才能和家人们机器交互,如 何判断人物的状态是首当其冲需要解决的问题。
[0004]现有技术中的人体目标识别检测算法占得智能芯片较多得计算性能,因为人体目标识 别检测是整个监控系统第一部分,它首先将摄像头拍摄的整张图片输入到检测算法中,一 般计算性能较小智能芯片很难在视频拍摄中实时得监控人物。随着深度学习的大热,目标 检测领域的算法模型引入了视频监控领域,但是眼花缭乱的复杂模型并不能全都适用于现 在市场上的智能芯片,如何在有限的成本情况下选用合适的算法达到实时效果是各大厂商 的争夺的焦点。
[0005]因此,急需一种能够有效降低人体目标识别检测的计算量的同时,又能够具有较高的 精准率和召回率的人体目标识别方法和系统。

技术实现思路

[0006]本专利技术针对上述缺陷,提供一种目标识别方法及系统。本专利技术通过改进主干网络层为 gconv层和G_CSP改进残差层,并对主干网络层和Neck特征处理层对分组卷积后得到的 图片进行预处理以及多尺度融合过程中使用深度可分离卷积以及分组数为g组的分组卷 积,,通过加乘的分解步骤减少整体网络的参数量,降低计算量的同时在Neck特征处理 层保留SPP空间池化金字塔层的同时,在SPP空间池化金字塔层与Neck特征处理层的第 二CBL层之间增加同时使用均值池化和最大值池化的CBAM卷积注意层,既考虑到了全 局视野也突出了目标明显的特征细节,通过构建Ciou损失函数Clou
Loss
并构建宽高比例γ 函数,优化预测框的输出结构评价指标。经过实验对比改进的Yolov5s模型在精度、召回 率、检测速度、GPU性能上均有提升。
[0007]能够有效降低人体目标识别检测的计算量的同时,又能够具有较高的精准率和召回率
[0008]本专利技术提供如下技术方案:一种人体目标识别方法,采用改进的轻量型Yolov5s网络 目标检测模型,所述方法包括以下步骤:
[0009]1)实时采集人体目标运动视频,所述人体目标运动视频中每一帧原始人体目标运动 图片输入模型;
[0010]2)对所述原始人体目标运动图片进行预处理;
[0011]3)对所述步骤2)得到的预处理后的人体目标运动图片进行多尺度融合;
[0012]4)构建Ciou损失函数Clou
Loss
和宽高比例γ函数;
[0013]5)评估所述步骤3)多尺度融合后的预测框内图像与真实框内图像的人体目标识别 定位的建Ciou损失函数Clou
Loss
值和宽高比例γ函数值,若Ciou
Loss
<0.2且γ<0.03则完 成人体目标识别,并输出得到识别的人体目标图像,否则重复所述步骤1)

3)。
[0014]进一步地,所述步骤2)中对所述原始人体目标运动图片进行预处理包括:
[0015]2.1)对所述步骤1)采集到的大小为X
×
X
×
3的原始人体目标运动图片降维,得到大 小为的特征图,将所述原始图片上的信息保存在通道数上;
[0016]2.2)对所述2.1)步骤得到的图片进行二分组卷积,拼接得到主干最终特征图;
[0017]2.3)对所述步骤2.2)拼接得到的最终特征图进行深度可分离卷积和分组数为g组的 分组卷积,通过加乘的分解步骤减少整体网络的参量数;
[0018]2.4)重复所述步骤2.2)

2.3)两次,完成对所述原始人体目标运动图片的预处理。
[0019]进一步地,所述步骤2.1)中的X的大小为80

640。
[0020]进一步地,所述步骤3)中对所述步骤2)得到的预处理后的人体目标运动图片进行 多尺度融合包括以下步骤:
[0021]3.1)对预处理后的人体目标运动图片进行二分组卷积,拼接得到Neck特征处理最终 特征图;
[0022]3.2)使用不同尺寸的池化窗口分别对数据进行池化,然后再对不同池化窗口的池化 结果进行拼接,进行多尺度融合;
[0023]3.3)对所述步骤3.2)多尺度融合后的图像进行深度可分离卷积和分组数为g组的分 组卷积,通过加乘的分解步骤减少整体网络的参量数;
[0024]3.4)对所述3.3)步骤处理后得到的图片同时使用均值池化和最大值池化,构建CBAM 卷积注意池化模型,将所述步骤3.3)处理后大小为H
×
W
×
C的输入特征图池化为大小为 H
×
W
×
1的输出特征图;
[0025]3.5)对所述步骤3.4)得到的池化为H
×
W
×
1的输出特征图进行普通卷积后输出。
[0026]进一步地,所述3.4)步骤中构建的CBAM卷积注意池化模型公式如下:
[0027]M
s
(F)=σ(f7×7([AvgPool(F);MaxPool(F)]));
[0028]其中,σ表示sigmoid激活函数,f7×7表示7
×
7卷积核的卷积操作,AvgPool(F)表示 均值池化,MaxPool(F)表示最大值池化,F为所述步骤3.3)处理后大小为H
×
W
×
C的输 入特征图。
[0029]进一步地,所述步骤3.2)中的池化窗口的尺寸为5
×
5、9
×
9和13
×
13。
[0030]进一步地,所述深度可分离卷积,包括:将输入大小为D
F
×
D
F
×
N的特征图,转换为 N个标准卷积核D
K
×
D
K
×
M,然后再将每个所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种人体目标识别方法,采用改进的轻量型Yolov5s网络目标检测模型,其特征在于,所述方法包括以下步骤:1)实时采集人体目标运动视频,所述人体目标运动视频中每一帧原始人体目标运动图片输入模型;2)对所述原始人体目标运动图片进行预处理;3)对所述步骤2)得到的预处理后的人体目标运动图片进行多尺度融合;4)构建Ciou损失函数Ciou
Loss
和宽高比例γ函数;5)评估所述步骤3)多尺度融合后的预测框内图像与真实框内图像的人体目标识别定位的建Ciou损失函数Ciou
Loss
值和宽高比例γ函数值,若Ciou
Loss
<0.2且γ<0.03则完成人体目标识别,并输出得到识别的人体目标图像,否则重复所述步骤1)

3)。2.根据权利要求1所述的人体目标识别方法,其特征在于,所述步骤2)中对所述原始人体目标运动图片进行预处理包括:2.1)对所述步骤1)采集到的大小为X
×
X
×
3的原始人体目标运动图片降维,得到大小为的特征图,将所述原始图片上的信息保存在通道数上;2.2)对所述2.1)步骤得到的图片进行二分组卷积,拼接得到主干最终特征图;2.3)对所述步骤2.2)拼接得到的最终特征图进行深度可分离卷积和分组数为g组的分组卷积,通过加乘的分解步骤减少整体网络的参量数;2.4)重复所述步骤2.2)

2.3)两次,完成对所述原始人体目标运动图片的预处理。3.根据权利要求2所述的人体目标识别方法,其特征在于,所述步骤2.1)中的X的大小为80

640。4.根据权利要求1所述的人体目标识别方法,其特征在于,所述步骤3)中对所述步骤2)得到的预处理后的人体目标运动图片进行多尺度融合包括以下步骤:3.1)对预处理后的人体目标运动图片进行二分组卷积,拼接得到Neck特征处理最终特征图;3.2)使用不同尺寸的池化窗口分别对数据进行池化,然后再对不同池化窗口的池化结果进行拼接,进行多尺度融合;3.3)对所述步骤3.2)多尺度融合后的图像进行深度可分离卷积和分组数为g组的分组卷积,通过加乘的分解步骤减少整体网络的参量数;3.4)对所述3.3)步骤处理后得到的图片同时使用均值池化和最大值池化,构建CBAM 卷积注意池化模型,将所述步骤3.3)处理后大小为H
×
W
×
C的输入特征图池化为大小为H
×
W
×
1的输出特征图;3.5)对所述步骤3.4)得到的池化为H
×
W
×
1的输出特征图进行普通卷积后输出。5.根据权利要求4所述的人体目标识别方法,其特征在于,所述3.4)步骤中构建的CBAM卷积注意池化模型公式如下:M
s
(F)=σ(f7×7([AvgPool(F);MaxPool(F)]));其中,σ表示sigmoid激活函数,f7×7表示7
×
7卷积核的卷积操作,AvgPool(F)表示均值池化,MaxPool(F)表示最大值池化,F为所述步骤3.3)处理后大小为H
×
W
×
C的输入特征图。6.根据权利要求4所述的人体目标识别方法,其特征在于,所述步骤3.2)中的池化窗口
的尺寸为5
×
5、9
×
9和13
×
13。7.根据权利要求2或4所述的人体目标识别方法,其特征在于,所述深度可分离卷积,包括:将输入大小为D
F
×
D
...

【专利技术属性】
技术研发人员:黄炳强项新建潘磊厉阳
申请(专利权)人:浙江科技学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1