行人检测方法及系统、数据处理设备及程序、存储介质技术方案

技术编号：40105074 阅读：8 留言：0更新日期：2024-01-23 18:17

本发明专利技术涉及行人检测方法及系统、数据处理设备及程序、存储介质。所述行人检测方法包括如下步骤：步骤S1：获取自然场景行人数据集；步骤S2：对所述自然场景行人数据集进行预训练并获得预训练模型；步骤S3：对所述预训练模型结合煤矿井下行人数据集进行训练获得煤矿井下行人检测模型。本公开提高了模型的特征提取性能，能更好地捕捉煤矿井下环境中的行人目标，同时提高了模型训练的稳定性以及在复杂环境下的适应性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及煤矿安全；具体而言，本专利技术涉及行人检测方法及系统、数据处理设备及程序、存储介质。

技术介绍

1、大型矿山事故频发，造成大量人员伤亡和财产损失。采矿业需要向无人化、智能化方向发展。

2、在采煤机危险区域检测行人至关重要，当在危险区域检测到行人时，必须发出警报通知并及时处理，以防止事故的发生。

3、然而，煤矿井下环境的复杂性使行人检测成为了一项极具挑战的任务。这些环境通常伴随着光照不匀、粉尘密集、电缆干扰、障碍物等复杂因素导致模型在识别和定位行人方面出现错误、影响目标检测模型的性能。现有的网络模型的主干模块在提取特征时存在信息丢失、接收野大小固定、缺乏上下文信息等缺点，激活函数在网络训练中也可能会存在梯度消失、过拟合等现象。

4、在煤矿井下环境中，进行行人检测时仍然存在误检测率高导致虚警，对矿工的安全监测不准确；漏检测率高，无法准确识别所有行人，从而增加了安全风险；缺乏鲁棒性，在光照条件差、目标遮挡等情况时的鲁棒性有限，模型的主干模块和激活函数难以适应多样化的井下工作环境。

5、因此，现有的网络模型无法满足在煤矿井下环境中行人检测的高精度和鲁棒性要求。

技术实现思路

1、有鉴于此，本专利技术提供了行人检测方法及系统、数据处理设备及程序、存储介质，从而解决或者至少缓解了现有技术中存在的上述问题和其它方面的问题中的一个或多个。

2、为了实现前述目的，本专利技术的第一方面提供了一种基于yolov7的煤矿井下行人检测

3、步骤s1：获取自然场景行人数据集；

4、步骤s2：对所述自然场景行人数据集进行预训练并获得预训练模型；

5、步骤s3：对所述预训练模型结合煤矿井下行人数据集进行训练获得煤矿井下行人检测模型。

6、在如前所述的行人检测方法中，可选地，在所述预训练和所述训练的过程中分别将可变形注意力机制引入到所述yolov7的主干特征提取模块中的cbs1模块和cbs2模块的后面，将所述yolov7的激活函数设置为frelu，所述frelu通过以下公式实现：

7、，

8、其中“”表示激活单元的输入，“”表示与所述激活单元相关的可学习参数，“max”表示最大操作。

9、在如前所述的行人检测方法中，可选地，所述cbs1模块和所述cbs2模块的步长分别设置为1和2。

10、在如前所述的行人检测方法中，可选地，在图像特征通过所述cbs2模块后得到的特征图为，将所述特征图输入到所述可变形注意力机制中，在所述可变形注意力机制中，当网格尺寸是j × j时，所述j为假设的正整数，根据输入可产生查询向量q，生成一个大小为的均匀网格点即参考点，其中，，所述参考点的值为，将其归一化后将所述查询向量q输入到偏置学习网络offset中得到每个所述参考点的偏移量，将所述偏移量和所述参考点相加得到变形点；

11、通过预定义的控制偏移量幅度的超参数s调整所述偏移量，然后在所述变形点所在的区域对其特征进行采样，生成变形后的键向量和值向量，将每个所述头部特征连接在一起，并通过投影矩阵进行投影，得到最终输出r，，其中，为投影矩阵，（）为连接函数。

12、在如前所述的行人检测方法中，可选地，在步骤s3中可以通过以下步骤对所述预训练模型进行训练：

13、步骤s3.1：获取所述煤矿井下行人数据集，通过摄像仪器采集煤矿井下采煤机附近的行人视频并从中提取出含有行人的照片作为所述煤矿井下行人数据集进行处理；

14、步骤s3.2：将所述预训练模型作为初始训练模型，再根据所述煤矿井下行人数据集对所述预训练模型进行训练；

15、步骤s3.3：调整学习率并获得煤矿井下行人检测模型。

16、在如前所述的行人检测方法中，可选地，在所述步骤s3.1中，对所述煤矿井下行人数据集打上标签并将所述煤矿井下行人数据集划分为训练集、验证集和测试集。

17、在如前所述的行人检测方法中，可选地，在所述预训练和所述训练过程中，将迭代次数设置为100次，batch-size设置为8，输入图像的尺寸缩放为640×640，初始学习率设置为0.01，权重衰减设置为0.005。

18、为了实现前述目的，本专利技术的第二方面提供了一种煤矿井下行人检测系统，其中，所述行人检测系统包括：

19、行人数据集获取模块，所述行人数据集获取模块用于获取目标场景下的行人数据集；

20、训练模型获取模块，所述训练模型获取模块用于基于yolov7通过对所述行人数据集进行预训练和训练获得煤矿井下行人检测模型。

21、为了实现前述目的，本专利技术的第三方面提供了一种数据处理设备，其中，所述数据处理设备包括：

22、存储器，所述存储器用于存储计算机可执行指令或者计算机程序；

23、处理器，所述处理器用于执行所述存储器中存储的计算机可执行指令或计算机程序时，实现如前述第一方面中任一项所述的行人检测方法。

24、为了实现前述目的，本专利技术的第四方面提供了一种计算机可读存储介质，其中，所述计算机可读存储介质存储由计算机可执行指令或者计算机程序，所述计算机可执行指令或者计算机程序被处理器执行时，实现如前述第一方面中任一项所述的行人检测方法。

25、为了实现前述目的，本专利技术的第五方面提供了一种计算机程序，其中，所述计算机程序包括计算机可执行执行指令或者计算机程序，所述计算机可执行指令或者计算机程序被处理器执行时，实现如前述第一方面中任一项所述的行人检测方法。

26、本公开提出了行人检测方法及系统、数据处理设备及程序、存储介质，其中设置了预训练的方式，提高了模型的性能。

27、在可选的技术方案中，所述行人检测方法在yolov7算法的主干特征提取网络中引入可变形注意力机制，使模型能够更自适应地调整关注区域，无需受固定窗口大小的限制，增加了捕捉关键特征的能力，特别是在目标位置或形状变化较大的情况下；采用了frelu激活函数，缓解了梯度消失和过拟合的现象；设置了预训练的方式，精确计算改进后的参数，提高了算法的性能。

本文档来自技高网...

【技术保护点】

1.一种基于YOLOv7的煤矿井下行人检测方法，其特征在于，所述行人检测方法包括如下步骤：

2.如权利要求1所述的行人检测方法，其特征在于，在所述预训练和所述训练的过程中分别将可变形注意力机制引入到所述YOLOv7的主干特征提取模块中的CBS1模块和CBS2模块的后面，将所述YOLOv7的激活函数设置为FReLU，所述FReLU通过以下公式实现：

3.如权利要求2所述的行人检测方法，其特征在于，所述CBS1模块和所述CBS2模块的步长分别设置为1和2。

4. 如权利要求2所述的行人检测方法，其特征在于，在图像特征通过所述CBS2模块后得到的特征图为，将所述特征图输入到所述可变形注意力机制中，在所述可变形注意力机制中，当网格尺寸是j × j时，所述j为假设的正整数，根据输入可产生查询向量Q，生成一个大小为的均匀网格点即参考点，其中，，所述参考点的值为，将其归一化后将所述查询向量Q输入到偏置学习网络Offset中得到每个所述参考点的偏移量，将所述偏移量和所述参考点相加得到变形点；

5.如权利要求1或2所述的行人检测方法，其特征在于，在步

6.如权利要求5所述的行人检测方法，其特征在于，在所述步骤S3.1中，对所述煤矿井下行人数据集打上标签并将所述煤矿井下行人数据集划分为训练集、验证集和测试集。

7.如权利要求1或2所述的行人检测方法，其特征在于，在所述预训练和所述训练过程中，将迭代次数设置为100次，batch-size设置为8，输入图像的尺寸缩放为640×640，初始学习率设置为0.01，权重衰减设置为0.005。

8.一种煤矿井下行人检测系统，其特征在于，所述行人检测系统包括：

9.一种数据处理设备，其特征在于，所述数据处理设备包括：

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储由计算机可执行指令或者计算机程序，所述计算机可执行指令或者计算机程序被处理器执行时，实现如权利要求1至7中任一项所述的行人检测方法。

11.一种计算机程序，其特征在于，所述计算机程序包括计算机可执行执行指令或者计算机程序，所述计算机可执行指令或者计算机程序被处理器执行时，实现如权利要求1至7中任一项所述的行人检测方法。

...

【技术特征摘要】

1.一种基于yolov7的煤矿井下行人检测方法，其特征在于，所述行人检测方法包括如下步骤：

2.如权利要求1所述的行人检测方法，其特征在于，在所述预训练和所述训练的过程中分别将可变形注意力机制引入到所述yolov7的主干特征提取模块中的cbs1模块和cbs2模块的后面，将所述yolov7的激活函数设置为frelu，所述frelu通过以下公式实现：

3.如权利要求2所述的行人检测方法，其特征在于，所述cbs1模块和所述cbs2模块的步长分别设置为1和2。

4. 如权利要求2所述的行人检测方法，其特征在于，在图像特征通过所述cbs2模块后得到的特征图为，将所述特征图输入到所述可变形注意力机制中，在所述可变形注意力机制中，当网格尺寸是j × j时，所述j为假设的正整数，根据输入可产生查询向量q，生成一个大小为的均匀网格点即参考点，其中，，所述参考点的值为，将其归一化后将所述查询向量q输入到偏置学习网络offset中得到每个所述参考点的偏移量，将所述偏移量和所述参考点相加得到变形点；

5.如权利要求1或2所述的行人检测方法，其特征在于，在步骤s3中可以通过...

【专利技术属性】
技术研发人员：胡涛，庄德玉，邱锦波，方彤，郑立波，张启志，郑东，钱江泳，汤子麟，袁安祥，
申请(专利权)人：中煤科工集团上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人