基于改进YOLOv5的跌倒行为检测方法及系统技术方案

技术编号:34536487 阅读:41 留言:0更新日期:2022-08-13 21:31
本发明专利技术提供基于改进YOLOv5的跌倒行为检测方法及系统,方法包括:首先将YOLOv5的边界框损失函数GIoU更换为CIoU,然后在YOLOv5的主干网络中的残差组件后加入卷积块注意力机制(Convolutional Block Attention Module,CBAM)模块,该机制将位置信息嵌入到通道注意力当中,使网络可以更专注地学习跌倒这一特征;最后将特征融合层的特征金字塔网络结构替换成加权双向特征金字塔(BiFPN)网络结构,充分利用不同尺度的特征,从而提高检测精度。本发明专利技术解决了平均精度低、侵入性强、适用场景受有限制以及检测速度慢的技术问题。有限制以及检测速度慢的技术问题。有限制以及检测速度慢的技术问题。

【技术实现步骤摘要】
基于改进YOLOv5的跌倒行为检测方法及系统


[0001]本专利技术涉及老年人监护监测技术,具体涉及基于改进YOLOv5的跌倒行为检测方法及系统。

技术介绍

[0002]世界老年人口正在迅速增长。在中国,65岁以上人口占总人口的10.1%,到2050 年将增加到35%左右[1]。在日本,内部事务和通信省统计局的数据显示,2019年,65 岁以上的人占总人口的28.4%[2]。随着年龄的增长,以及高血压、低血压、膝关节疼痛等身体疾病的存在,老年人逐渐不能稳定地控制自己的运动,导致跌倒次数增多。根据世界卫生组织的数据表明,跌倒是意外死亡的第二大原因[3]。老年人若因严重受伤或昏迷摔倒,无法及时寻求帮助,很可能导致死亡。因此,提出一种有效的跌倒检测方法是十分必要的。
[0003]近年来,跌倒检测方法根据获取跌倒特征方式的不同主要分为三类:基于可穿戴传感器的方法、基于环境传感器的方法和基于计算机视觉的方法。
[0004]基于可穿戴传感器的方法主要通过让老年人佩戴特定的传感器来确定他们的行为状态或位置信息。大部分的研究都是基于加速度计的研究,其方法是通过分析和采集多个轴的加速度来判断是否发生跌倒。例如,Chaitep和Chawachat提出了一种算法,该算法使用加速度计读数导出的重力值来检测下落。Shahzad等人在2017年实现了一种基于加速度计的跌倒事件检测系统,随后他们进一步提出了一种仅使用加速度计的高精度跌倒检测方法。在文献,Yacchirema等人,2018年的另一项研究中,作者将3d轴加速度计嵌入6LowPAN可穿戴设备中,以收集运动信息,并应用决策树算法来识别跌倒。虽然相比较与环境传感器而言,采用穿戴传感器的方法检测跌倒要更加便宜、更容易操作。然而,它们的最大缺点是侵入性很强。
[0005]基于环境传感器的方法,文献将传感器放置在室内,用于检测不同的信号。信号主要包括压力、振动、音频、红外阵列、Wi

Fi、雷达等。这种跌倒检测方法的主要原理是利用无线技术识别物体周围环境的变化,从而通过无线信号的变化判断人体行为状态。相比于可穿戴式设备,它的优点在于可以在老年人不戴任何设备的情况下判断是否发生跌倒,起到了很好的隐私保护作用。然而,这种方法成本较高,并且由于需要不断地接收信号,这对于传感器的位置有一定要求,从而导致检测距离有所限制。
[0006]随着计算机视觉和目标检测的发展,基于计算机视觉的跌倒检测已成为一种重要的方法,该系统对老年人的入侵小,精度高,鲁棒性强。目前,根据是否需要形成候选框,目标检测算法可分为两类:一类是需要形成候选框的两阶段目标检测算法,另一类是不需要生成候选框的一阶段目标检测算法。基于两个阶段的检测方法主要包括:RCNN、 SPP

NET、Fast

RCNN、Faster

RCNN、Mask

RCNN等。基于一阶段的检测算法主要有YOLO 系列算法和SSD算法。公开号为CN112560723A的专利技术专利申请文献《一种基于形态识别与速度估计的跌倒检测方法及系统》包括构建形态识别模型和速度估计模型;获取待检测的视频流,待检测的视频流包括连续的若干帧图像;将待检测的视频流输入至速度估计模型中,得到待检测
的视频流所对应的人体形态变化速度;将待检测的视频流输入至形态识别模型,形态识别模型检测每一帧图像中的人体形态,并按照时间序列关联同一人物的人体形态,输出若干帧图像中每个人物的人体形态变化过程;根据人体形态变化速度以及人体形态变化过程,判断待检测的视频流中是否发生跌倒事件。该现有专利申请文献还披露了下述技术方案:关联人体形态,即将同一人物在不同帧中的人物候选框进行关联,从而得到每个人物的人体形态变化过程。多目标候选框前后帧关联有多种方式,下面举例说明:维护“正在追踪目标候选框”列表;获取最新图像帧中的人物候选框信息,记作“当前候选框信息”,计算“当前候选框信息”与“正在追踪目标候选框”的交并比,通过匈牙利算法实现候选框匹配;若当前候选框中存在无匹配样本,则添加到“正在追踪目标候选框”列表;若“正在追踪目标候选框”列表中存在无匹配样本,则在列表中删除该元素。构建的形态识别模型可以是包括目标检测网络(常用网络包括Yolo/SSD/Faster R

CNN)和候选框关联网络(常用网络包括DeepSort)。或者,形态识别模型可以是包括多目标姿态估计网络(常用网络包括OpenPose/HRNet/RSN)、单人骨架分类网络(常用网络包括GCN)以及候选框关联网络(常用网络包括DeepSort)。由于事先需要设好候选框,因此两阶段的目标检测算法的精度相比于一阶段的要高,但是检测速度会相对较慢。
[0007]综上,现有技术存在平均精度低、侵入性强、适用场景受有限制以及检测速度慢的技术问题。

技术实现思路

[0008]本专利技术所要解决的技术问题在于如何解决现有技术存在的平均精度低、侵入性强、适用场景受有限制以及检测速度慢的技术问题。
[0009]本专利技术是采用以下技术方案解决上述技术问题的:基于改进YOLOv5的跌倒行为检测方法包括:
[0010]S1、加载预置YOLOv5模型,初始化所述预置YOLOv5模型的参数;
[0011]S2、采集并预处理图像数据,据以得到训练数据集验证数据,根据所述训练数据提取图像特征并进行物体定位分类,计算损失函数,利用SGD优化所述预置YOLOv5模型的网络参数,根据所述验证数据计算mAP,据以迭代获取适用模型,其中,所述步骤S2 中采用预置CIOU损失函数作为预测框偏差的指标;
[0012]S3、采集并输入测试图片至所述适用模型,据以进行位置及分类预测,计算向前推导及NMS所用时间,据以在所述测试图片上画出最终跌倒行为识别结果,其中,所述步骤S3还包括:
[0013]S31、在所述预置YOLOv5模型中的残差组件后加入CBAM注意力机制,以卷积块注意力模型对所述测试图片的特征图进行最大池化、平均池化、拼接操作以及卷积操作,据以生成单通道矩阵,据以得到卷积块注意力处理结果;
[0014]S32、将所述卷积块注意力处理结果输入到Sigmoid激活函数,以得到主干网络特征;
[0015]S33、在所述预置YOLOv5模型中的特征金字塔中采用BiFPN结构,据以对不少于2 种尺度的所述主干网络特征进行双向跨尺度连接以及加权特征融合,以得到跨尺度特征融合识别数据,据以获取所述最终跌倒行为识别结果。
[0016]本专利技术将YOLOv5的边界框损失函数GIoU更换为CIoU,然后在YOLOv5的主干网络中的残差组件后加入卷积块注意力机制(Convolutional Block Attention Module, CBAM)模块,该机制将位置信息嵌入到通道注意力当中,使网络可以更专注地学习跌倒这一特征;最后将特征融合层的特征金字塔网络结构替换成加权双向特征金字塔(BiFPN) 网络结构,充分利用不本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于改进YOLOv5的跌倒行为检测方法,其特征在于,所述方法包括:S1、加载预置YOLOv5模型,初始化所述预置YOLOv5模型的参数;S2、采集并预处理图像数据,据以得到训练数据集验证数据,根据所述训练数据提取图像特征并进行物体定位分类,计算损失函数,利用SGD优化所述预置YOLOv5模型的网络参数,根据所述验证数据计算mAP,据以迭代获取适用模型,其中,所述步骤S2中采用预置CIOU损失函数作为预测框偏差的指标;S3、采集并输入测试图片至所述适用模型,据以进行位置及分类预测,计算向前推导及NMS所用时间,据以在所述测试图片上画出最终跌倒行为识别结果,其中,所述步骤S3还包括:S31、在所述预置YOLOv5模型中的残差组件后加入CBAM注意力机制,以卷积块注意力模型对所述测试图片的特征图进行最大池化、平均池化、拼接操作以及卷积操作,据以生成单通道矩阵,据以得到卷积块注意力处理结果;S32、将所述卷积块注意力处理结果输入到Sigmoid激活函数,以得到主干网络特征;S33、在所述预置YOLOv5模型中的特征金字塔中采用BiFPN结构,据以对不少于2种尺度的所述主干网络特征进行双向跨尺度连接以及加权特征融合,以得到跨尺度特征融合识别数据,据以获取所述最终跌倒行为识别结果。2.根据权利要求1所述的基于改进YOLOv5的跌倒行为检测方法,其特征在于,所述步骤S2中,以下述逻辑计算所述预置CIOU损失函数:Loss
CIoU
=1

CIoU其中,b代表预测框的中心点,b
gt
代表真实框的中心点,ρ表示计算b和b
gt
之间的欧式距离。c代表的是能够同时包含预测框和真实框的最小闭包区域的对角线距离、α是权重参数、v则是度量长宽比一致性的参数。3.根据权利要求1所述的基于改进YOLOv5的跌倒行为检测方法,其特征在于,所述步骤S31包括:S311、在所述预置YOLOv5模型中的残差组件后加入CBAM注意力机制,以形成CBAMC3模块;S312、以所述CBAMC3模块中的通道注意力模块对所述测试图片的特征图进行最大池化及平均池化操作,以得到池化一维向量;S313、将所述池化一维向量传递到预置的多层感知机MLP;S314、通过预置乘逻辑处理获得所述调整通道注意力特征图;S315、以所述CBAMC3模块中的空间注意模块对所述调整注意力特征图进行最大池化和平均池化操作,将两层进行拼接操作,并用7
×
7的卷积核进行卷积操作以生成所述单通道矩阵,据以获取所述卷积块注意力处理结果。4.根据权利要求3所述的基于改进YOLOv5的跌倒行为检测方法,其特征在于,所述步骤
S314中,通过下述逻辑处理获得所述调整通道注意力特征图:其中,W1和W2表示权重,和表示平均池化和最大池化后的feature map,σ为sigmoid激活函数。5.根据权利要求1所述的基于改进YOLOv5的跌倒行为检测方法,其特征在于,所述步骤S32中,通过下述逻辑,利用所述Sigmoid激活函数处理所述卷积块注意力处理结果:M
s
=σ(f
7*7
(F
s
...

【专利技术属性】
技术研发人员:张振亚何明艳王萍方博屈兴亮孙兆隽程红梅
申请(专利权)人:安徽建筑大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1