一种结合语义分割的室内实时摔倒检测算法制造技术

技术编号：38348319 阅读：13 留言：0更新日期：2023-08-02 09:28

发明专利技术名称一种结合语义分割的室内实时摔倒检测算法摘要本发明专利技术公开了一种结合语义分割的室内实时摔倒检测算法，包括以下步骤：(1)图像预处理：对输入视频帧/图片使用Mosaic数据增强、自适应锚框、自适应图片收缩策略；(2)人体摔倒特征提取：将步骤(1)处理后的视频帧/图片输入到改进后的YOLOv7摔倒检测网络中，对图像进行特征提取及分类；(3)将步骤(2)中所检测后的结果，输入到自建的语义分割网络，将其室内场景信息分割为可摔倒区域(床、沙发)和非摔倒区域(地面)；(4)摔倒判断：根据目标检测网络和语义分割网络综合判断目标是否摔倒。该方法可以减少室内场景下因类摔倒行为而导致误判的问题，并且改进的YOLOv7摔倒检测网络的计算复杂度、精度、速度都优于原网络，更易部署到实际应用中。实际应用中。实际应用中。

全部详细技术资料下载

【技术实现步骤摘要】
一种结合语义分割的室内实时摔倒检测算法

[0001]本专利技术涉及计算机视觉领域，具体为一种结合语义分割的室内实时摔倒检测算法。

技术介绍

[0002]有研究表明，摔倒已经成为了我国65岁以上老年人因伤致死的首位原因，并呈现逐年上升的趋势。由于老年人身体机能的衰退，很容易发生意外摔倒情况，而独居老人处于缺少甚至没有人看护的境地，若发生意外摔倒时，如果不能够及时就医，可能会导致终身残疾，甚至危及生命。因此，在老年人容易摔倒的地方部署用于摔倒检测的设施显得尤为重要。
[0003]目前，摔倒检测方法主要可以分为：基于可穿戴传感器的方法、基于环境部署的方法、基于计算机视觉的方法。以上方法中，基于可穿戴传感器的设备，老人佩戴时间过长可能会引起不适，或者忘记佩戴的可能；而基于环境部署的方法需要在特定场合部署，并且成本比较高；相比与前两种方法，基于计算机视觉的的摔倒检测方法具有对检测者实时进行监控、部署方便、成本低等优点。
[0004]现存的基于计算机视觉的摔倒检测算法大多分为两步：先对检测目标进行跟踪，再对目标的运动信息进行分析判定是否发生摔倒行为。这种方法虽然会减少误判率，但由于网络结构较复杂，所占用空间内存较多，很难部署到实际应用中；同时，目前所知的摔倒检测算法都很难辨别出摔倒行为和倒在床上休息、趴在沙发上看书这类类摔倒行为之间的区别。
[0005]为解决上述问题，本专利技术提出一种结合语义分割的室内实时摔倒检测算法，将YOLOv7中的标准卷积替换为分布偏移卷积，通过拆分的方式减少网络计算复杂度，实现...

【技术保护点】

【技术特征摘要】
1.一种结合语义分割的室内实时摔倒检测算法，其特征在于：所述方法主要通过以下步骤实现：(1)图像预处理：对输入视频帧/图片使用Mosaic数据增强、自适应锚框、自适应图片收缩策略；(2)人体摔倒特征提取：将步骤(1)处理后的视频帧/图片输入到改进后的YOLOv7摔倒检测网络中，对图像进行特征提取及分类，其中对YOLOv7的改进包括以下两点：(2
‑
1)将轻量级全局上下文注意力机制融入到YOLOv7网络的高效聚合模块ELAN层中，使其充分利用全局信息，加强对关键特征的权重，提高检测精度；(2
‑
2)将YOLOv7主干网络中的标准卷积层替换为分布偏移卷积，通过对标准卷积拆分的方式实现网络的轻量化，减少网络计算复杂度；(3)场景信息语义分割：将步骤(2)中所检测后的结果，输入到自建的语义分割网络中，对其室内场景信息进行分割，其中将床、沙发分割为可摔倒区域，地面区域分割为非摔倒区域；(4)摔倒判断：根据目标检测网络和语义分割网络综合判断目标是否摔倒，摔倒判决算法包括以下步骤：1)从步骤(2)中输出第一次摔倒判断结果，若检测目标无摔倒则直接输出无摔倒结果；2)若第一次判断结果为摔倒，则计算目标框像素点位置信息与步骤(3)中分割的可摔倒区域像素位置之间的IoU值，大于所设定阈值则判定为疑似摔倒行为，否则判定为摔倒。2.根据权利要求1中所述的一种结合语义分割的室内实时摔倒检测算法，其特征在于：所述步骤(1)图像预处理，首先，将一张选定的图片和随机的3张图片进行随机裁剪，再接到一张图上作为训练数据；其次，将锚框尺寸的计算嵌入到模型训练过程中，使模型能自动计算最佳锚框；最后，根据原始图片大小以及输入到网络的图片大小计算缩放比例，然后根据原始图片大小与缩放比例计算缩放后的图片大小，再算出黑边填充数值。3.根据权利要求1中所述的一种结合语义分割的室内实时摔倒检测算法，其特征在于：所述步骤(2)中改进的YOLOv7摔倒检测网络的具体结构包括：输入层、特征提取层、特征融合层、输出层；输入层通过图像预处理将图片处理为(640,640,3)的大小；特征提取层包括：预处理后的图片首先经过(DSConv+BN+SiLU)层
×
4后尺寸变为(160,160,128)，然后经过GC_ELAN层对全局特征进行提取，之后接入(MPConv+GC_ELAN)层
×
3后，分别输出三组大小为(80,80,512)、(40,40,1024)、(20,20,1024)的特征图，依次为A3、A4、A5；特征融合层包括两个步骤：1)自底向上的特征融合：A5通过SPPCSPC模块后通道数缩减为512，通过(DSConv+BN+SiLU)
×
1后进入Upsample层与A4相融合得到B4特征图，再通过一层ELAN层和Upsample层后与A3相融合得到B3特征图；2)自顶向下的特征融合：B3通过一层ELAN层和MPConv层后与B4层相融合得到C4特征图，再通过一层ELAN层和MPConv层后与A5层相融合得到C5特征图，同时B3经过一层ELAN输出C3特征图；最后特征融合分别输出三组大小为(80,80,256)、(40,40,512)、(20,20,1024)，依次是C3、C4、C5；输出层分别将C3、C4、C5特征图输入到RepConv层调整通道数，最后经过一层卷积对Objiectness、Class、Bbox三部分进行预测。
4.根据权利要求1中...

【专利技术属性】
技术研发人员：薛楠，王宁，王鹏，卢迪，王鑫磊，
申请(专利权)人：常州工学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人