一种人体目标识别方法及系统技术方案

技术编号：34558153 阅读：21 留言：0更新日期：2022-08-17 12:44

本发明专利技术提供一种人体目标识别方法系及系统，采用改进的轻量型Yolov5s网络目标检测模型，方法包括以下步骤：实时采集人体目标运动视频，人体目标运动视频中每一帧原始人体目标运动图片输入模型；进行预处理；进行多尺度融合；构建Ciou损失函数Ciou

全部详细技术资料下载

【技术实现步骤摘要】
一种人体目标识别方法及系统

[0001]本专利技术属于数字图像处理与模式识别
，具体涉及一种人体目标识别方法及系统。

技术介绍

[0002]近年来视频图像领域加速发展，监控设备上很容易把行人框选出来，但是想获得更多的人物信息来判断人物行为却较为困难，因为监控中有着环境的干扰、硬件设备算力的不支持、衡量获取信息的标准不统一等众多因素影响。此外，人体姿态估计与行为判断在生活场所的各方面得到运用，监控市场需求日益增加。
[0003]现阶段，我国智慧城市与数字经济的提出，为智慧城市未来部署规划，数字经济将会带动我国经济的大发展。在推进城市智能化的进程中，各个领域的智能硬件产业迅速发展，城市家庭中涌入了大量的智能化软件或者硬件，例如智能家居、互联网摄像头、交互式智慧机器人等等，同时众多智能设备中最受人们欢迎的是家庭联网摄像头，因为家庭环境下摄像头的分辨率不用太高，价格低廉，并且组成家庭监控功能操作步骤简单，一套简便的室内监控系统只要摄像头，存储硬盘和连接网络就可以。但是其中最核心的技术是机器视觉，家庭监控设备中的主体往往是人物，先检测了人物状态，才能和家人们机器交互，如何判断人物的状态是首当其冲需要解决的问题。
[0004]现有技术中的人体目标识别检测算法占得智能芯片较多得计算性能，因为人体目标识别检测是整个监控系统第一部分，它首先将摄像头拍摄的整张图片输入到检测算法中，一般计算性能较小智能芯片很难在视频拍摄中实时得监控人物。随着深度学习的大热，目标检测领域的算法模型引入了视频...

【技术保护点】

【技术特征摘要】
1.一种人体目标识别方法，采用改进的轻量型Yolov5s网络目标检测模型，其特征在于，所述方法包括以下步骤：1)实时采集人体目标运动视频，所述人体目标运动视频中每一帧原始人体目标运动图片输入模型；2)对所述原始人体目标运动图片进行预处理；3)对所述步骤2)得到的预处理后的人体目标运动图片进行多尺度融合；4)构建Ciou损失函数Ciou
Loss
和宽高比例γ函数；5)评估所述步骤3)多尺度融合后的预测框内图像与真实框内图像的人体目标识别定位的建Ciou损失函数Ciou
Loss
值和宽高比例γ函数值，若Ciou
Loss
＜0.2且γ＜0.03则完成人体目标识别，并输出得到识别的人体目标图像，否则重复所述步骤1)
‑
3)。2.根据权利要求1所述的人体目标识别方法，其特征在于，所述步骤2)中对所述原始人体目标运动图片进行预处理包括：2.1)对所述步骤1)采集到的大小为X
×
X
×
3的原始人体目标运动图片降维，得到大小为的特征图，将所述原始图片上的信息保存在通道数上；2.2)对所述2.1)步骤得到的图片进行二分组卷积，拼接得到主干最终特征图；2.3)对所述步骤2.2)拼接得到的最终特征图进行深度可分离卷积和分组数为g组的分组卷积，通过加乘的分解步骤减少整体网络的参量数；2.4)重复所述步骤2.2)
‑
2.3)两次，完成对所述原始人体目标运动图片的预处理。3.根据权利要求2所述的人体目标识别方法，其特征在于，所述步骤2.1)中的X的大小为80
‑
640。4.根据权利要求1所述的人体目标识别方法，其特征在于，所述步骤3)中对所述步骤2)得到的预处理后的人体目标运动图片进行多尺度融合包括以下步骤：3.1)对预处理后的人体目标运动图片进行二分组卷积，拼接得到Neck特征处理最终特征图；3.2)使用不同尺寸的池化窗口分别对数据进行池化，然后再对不同池化窗口的池化结果进行拼接，进行多尺度融合；3.3)对所述步骤3.2)多尺度融合后的图像进行深度可分离卷积和分组数为g组的分组卷积，通过加乘的分解步骤减少整体网络的参量数；3.4)对所述3.3)步骤处理后得到的图片同时使用均值池化和最大值池化，构建CBAM 卷积注意池化模型，将所述步骤3.3)处理后大小为H
×
W
×
C的输入特征图池化为大小为H
×
W
×
1的输出特征图；3.5)对所述步骤3.4)得到的池化为H
×
W
×
1的输出特征图进行普通卷积后输出。5.根据权利要求4所述的人体目标识别方法，其特征在于，所述3.4)步骤中构建的CBAM卷积注意池化模型公式如下：M
s
(F)＝σ(f7×7([AvgPool(F)；MaxPool(F)]))；其中，σ表示sigmoid激活函数，f7×7表示7
×
7卷积核的卷积操作，AvgPool(F)表示均值池化，MaxPool(F)表示最大值池化，F为所述步骤3.3)处理后大小为H
×
W
×
C的输入特征图。6.根据权利要求4所述的人体目标识别方法，其特征在于，所述步骤3.2)中的池化窗口
的尺寸为5
×
5、9
×
9和13
×
13。7.根据权利要求2或4所述的人体目标识别方法，其特征在于，所述深度可分离卷积，包括：将输入大小为D
F
×
D
...

【专利技术属性】
技术研发人员：黄炳强，项新建，潘磊，厉阳，
申请(专利权)人：浙江科技学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人