一种目标行人检测方法、系统、电子设备及介质技术方案

技术编号：40065671 阅读：3 留言：0更新日期：2024-01-16 23:23

本发明专利技术公开一种目标行人检测方法、系统、电子设备及介质，包括：S1：获取目标行人图像数据集，将目标行人图像数据集分为训练集和测试集；S2：设置目标行人检测模型：以YOLOv5算法为基本架构，对YOLOv5算法进行改进：将CBAM模块融合进YOLOv5主干网络中，替换掉原主干网络的C3模块；将改进后的FuseSoft‑NMS替换NMS，有利于更好的利用目标检测框的位置信息，提高目标定位的精度；S3：利用训练集对目标行人检测模型进行训练，直到所述图像分类模型的目标损失函数收敛或达到最大训练轮次，以获得训练好的图像分类模型；S4：利用训练好的目标行人检测模型对测试集进行检测，输出行人目标的目标行人图像检测结果，提高目标行人检测精度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及目标检测，具体涉及一种目标行人检测方法、系统、电子设备及介质。

技术介绍

1、随着我国经济进入新常态，城市化发展水平逐渐提升，老龄化问题已成为全球普遍存在的挑战；跌倒是日常生活中比较少见的人体行为，但是对于老年人又是致命的异常行为；

2、老年人由于不能像身体健康的年轻人一样，对跌倒时环境的变化做出及时有效的反应，尤其是对于独居老人，大多数时间子女亲人不在身边，缺乏应有的看护，使跌倒对他们的身体健康造成危害，更为严重的情况可能会由于错失最佳发现与抢救时间而导致跌倒老人发生死亡；随着当前计算机视觉和深度学习网络的发展，行人目标检测技术也取得了飞速的发展，能够准确高效的检测到行人是进行跌倒检测的前提条件，因此行人检测领域逐渐受到国内外研究学者的青睐与研究；

3、基于计算机视觉技术的跌倒检测方法是一种非侵入性技术，它可以使用摄像头等设备对人体进行实时监测；该技术可通过分析人体姿态、运动轨迹和动作特征等信息，准确地检测跌倒事件并及时报警；通过图像处理技术识别人体，利用提取人体的关键特征来检测跌倒事件。但是摄像头采集的图像背景复杂，且人体姿态多种多样，动作较为复杂，导致目标检测的效果较低，甚至无法检测出目标区域，从而影响人体动作的检测精度。

技术实现思路

1、鉴于以上所述现有技术的缺点，本专利技术提供一种目标行人检测方法、系统、电子设备及介质，用于提高目标行人检测精度。

2、为实现上述效果，本专利技术的技术方案如下：

3、第一个方面

4、s1：获取目标行人图像数据集，将目标行人图像数据集分为训练集和测试集；

5、s2：设置目标行人检测模型：以yolov5算法为基本架构，对yolov5算法进行改进：将cbam模块融合进yolov5主干网络中，替换掉原主干网络的c3模块；将改进后的fusesoft-nms替换nms；

6、s3：利用训练集对目标行人检测模型进行训练，直到所述图像分类模型的目标损失函数收敛或达到最大训练轮次，以获得训练好的图像分类模型；

7、s4：利用训练好的目标行人检测模型对测试集进行检测，输出行人目标的目标行人图像检测结果。

8、进一步的，步骤s1之后包括：对训练集和测试集进行预处理，所述预处理包括旋转、缩放比例、裁剪、遮挡、颜色变化以及数据标注。

9、进一步的，所述cbam模块包括cam模块和sam模块，获取cam模块中每个通道的权重值，基于权重值对所有通道进行加权计算，得到合并池化结果；基于合并池化结果计算通道注意力；由sam模块计算空间注意力；

10、训练集经过cbam模块进行特征提取，得到特征图经过cam模块,生成一维通道注意力向量，将特征图和相乘,得到通道特征权重匹配的；将通过空间注意力模块后生成二维空间注意力矩阵，将在每个通道的二维图像与相乘得到新的空间特征权重匹配的；其中，c表示特征图中的通道数，h代表特征图的长度，w是特征图的宽度；计算过程为：

11、(1)

12、(2)

13、式中，代表中间状态，代表输出状态，mc ,ms分别为通道注意力图和空间注意力图；

14、输入的特征图通过全局最大值池化和全局平均值池化操作，得到两个的特征图，之后通过一个多层感知器，得到输出特征图；将输出特征图进行基于element-wise的加和操作、sigmoid激活函数操作，得到通道注意力特征；将通道注意力特征和输入的特征图进行element-wise乘法操作，得到cam模块输出的通道注意力特征图，将cam模块输出的通道注意力特征图作为sam模块的输入特征图；

15、使用cam模块输出的通道注意力特征图当作输入sam模块进行channel操作、最大值池化和平均值池化，得到两个的特征图，将两个的特征图拼接后经过卷积操作降维，得到的特征图，的特征图经过sigmoid函数生成空间注意力特征，空间注意力特征与sam模块输入的通道注意力特征进行element-wise乘法操作，生成最终的目标行人图像特征图。

16、进一步的，所述fusesoft-nms基于soft-nms，通过设置一个高阈值，每次保留最大置信度的检测框m，并计算余下的检测框m和预设的检测框的交并比iou值；当高阈值小于交并比iou的值时，合并检测框m和检测框的值，即把检测框m和检测框的位置参数按照置信度为权值进行平均，平均位置参数替换检测框m的位置参数，检测框的置信度和检测框m的置信度的平均替换检测框m的置信度，删除检测框并保留检测框m，当交并比iou小于时按照soft-nms把检测框的置信度经过衰减函数进行衰减，表达式为：

17、(3)

18、式中，函数是soft-nms里的高斯衰减函数，表达式如公式（5）所示，a和b均为图像预测阶段产生的检测框；函数表达式为：

19、=(4)

20、式中，表示调节衰减程度，soft-nms将置信度与交并比iou相关的高斯加权函数相乘，若交并比iou值比较低时衰减度则较为平缓，交并比iou值越接近于1，则衰减程度越大；

21、=(5)

22、式中， xa、 xb和 ya是检测框中心坐标， wa和 ha是检测框的宽和高， sa和 sb是检测框的置信度； x'a和 y'a是更新后的检测框中心坐标， w'a和 h'a是更新后的检测框的宽和高， s'a是更新后的检测框的置信度；当交并比iou大于等于阈值的检测框时，把计算到的位置参数和当前置信度最高的检测框位置参数用置信度s做权值平均计算。

23、进一步的，所述合并池化结果通过如下公式计算：

24、mergepool(f)=(αmaxpool(f)+βavgpool(f))/2；

25、式中，mergepool(f)为合并池化结果；maxpool(f)为最大值池化结果；avgpool(f)为平均值池化结果；α为最大值池化的加权系数；β为平均值池化的加权系数；且满足α+β=1。

26、进一步的，通过如下公式计算cam模块的通道注意力：

27、mc(f)=σ'(mlp(maxpool(f))+mlp(mergepool(f)))；

28、式中，mc(f)为通道注意力；σ'为激活函数；mlp为包含一个隐藏层的神经网络。

29、进一步的，通过如下公式计算sam模块的空间注意力：

30、ms(f)=σ'(f7×7([maxpool本文档来自技高网...

【技术保护点】

1.一种目标行人检测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述一种目标行人检测方法，其特征在于，步骤S1之后包括：对训练集和测试集进行预处理，所述预处理包括旋转、缩放比例、裁剪、遮挡、颜色变化以及数据标注。

3.根据权利要求1所述一种目标行人检测方法，其特征在于，所述CBAM模块包括CAM模块和SAM模块，获取CAM模块中每个通道的权重值，基于权重值对所有通道进行加权计算，得到合并池化结果；基于合并池化结果计算通道注意力；由SAM模块计算空间注意力；

4.根据权利要求3所述一种目标行人检测方法，其特征在于，所述FuseSoft-NMS基于Soft-NMS，通过设置一个高阈值，每次保留最大置信度的检测框M，并计算余下的检测框M和预设的检测框的交并比IOU值；当高阈值小于交并比IOU的值时，合并检测框M和检测框的值，即把检测框M和检测框的位置参数按照置信度为权值进行平均，平均位置参数替换检测框M的位置参数，检测框的置信度和检测框M的置信度的平均替换检测框M的置信度，删除检测框并保留检测框M，当交并比IOU小于时按照Soft-NMS把检

5.根据权利要求4所述一种目标行人检测方法，其特征在于，所述合并池化结果通过如下公式计算：

6.根据权利要求5所述一种目标行人检测方法，其特征在于，通过如下公式计算CAM模块的通道注意力：

7.根据权利要求6所述一种目标行人检测方法，其特征在于，通过如下公式计算SAM模块的空间注意力：

8.一种目标行人检测系统，其特征在于，包括：

9.一种电子设备，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行所述权利要求1至7中任一项所述的一种目标行人检测方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括存储的计算机程序，其中，所述计算机程序运行时执行所述权利要求1至7中任一项所述的一种目标行人检测方法。

...

【技术特征摘要】

1.一种目标行人检测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述一种目标行人检测方法，其特征在于，步骤s1之后包括：对训练集和测试集进行预处理，所述预处理包括旋转、缩放比例、裁剪、遮挡、颜色变化以及数据标注。

3.根据权利要求1所述一种目标行人检测方法，其特征在于，所述cbam模块包括cam模块和sam模块，获取cam模块中每个通道的权重值，基于权重值对所有通道进行加权计算，得到合并池化结果；基于合并池化结果计算通道注意力；由sam模块计算空间注意力；

4.根据权利要求3所述一种目标行人检测方法，其特征在于，所述fusesoft-nms基于soft-nms，通过设置一个高阈值，每次保留最大置信度的检测框m，并计算余下的检测框m和预设的检测框的交并比iou值；当高阈值小于交并比iou的值时，合并检测框m和检测框的值，即把检测框m和检测框的位置参数按照置信度为权值进行平均，平均位置参数替换检测框m的位置参数，检测框的置信度和检测框m的置信度...

【专利技术属性】
技术研发人员：徐萌兮，徐浩宇，苏秀娥，汤琴琴，王晟懿，匡思雨，耿良炜，张莉雯，
申请(专利权)人：无锡学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人