煤矿三违行为识别模型训练方法、装置及存储介质制造方法及图纸

技术编号:39176224 阅读:12 留言:0更新日期:2023-10-27 08:24
本公开提出一种煤矿三违行为识别模型训练方法、装置及存储介质,方法包括:获取非平衡率小于等于第一阈值的三违行为样本和安全行为样本,其中,每种样本至少包括以下指标:人员学历、工作年限、健康指标、作业时间、作业地点、作业班次、事件类型、上下井时间,对三违行为样本和安全行为样本进行聚类以得到多个候选聚类簇,并从多个候选聚类簇中筛选三违行为样本数量大于第二阈值的目标聚类簇,采用SMOTE算法对目标聚类簇进行过采样,以得到平衡样本数据集,以及基于平衡样本数据集对目标模型进行训练,以得到三违行为识别模型,能够训练识别模型以准确识别三违行为,保证煤矿开采的安全性。性。性。

【技术实现步骤摘要】
煤矿三违行为识别模型训练方法、装置及存储介质


[0001]本公开涉及煤矿生产安全
,尤其涉及一种煤矿三违行为识别模型训练方法、装置及存储介质。

技术介绍

[0002]煤矿开采属于井下作业,作业空间有限、采光条件较差、地质环境复杂,存在瓦斯、粉尘等有害因素。煤矿安全问题是制约煤矿产业、社会稳定发展的重要因素,而“三违”行为是导致煤矿生产安全事故发生的主要因素。当前对于三违行为的处理方式主要是事后发现、事后纠正,无法做到事前管理、事前防控,并对问题的处理停留在表象上,未深入挖掘三违行为发生的原因。因此,能否事先识别三违行为将直接影响煤矿开采的安全性。

技术实现思路

[0003]本公开提出了一种煤矿三违行为识别模型训练方法、装置及存储介质,旨在至少在一定程度上解决相关技术中的技术问题之一。
[0004]本公开第一方面实施例提出了一种煤矿三违行为识别模型训练方法,获取非平衡率小于等于第一阈值的三违行为样本和安全行为样本,其中,每种样本至少包括以下指标:人员学历、工作年限、健康指标、作业时间、作业地点、作业班次、事件类型、上下井时间;对三违行为样本和安全行为样本进行聚类以得到多个候选聚类簇,并从多个候选聚类簇中筛选三违行为样本数量大于第二阈值的目标聚类簇;采用SMOTE算法对目标聚类簇进行过采样,以得到平衡样本数据集;以及基于平衡样本数据集对目标模型进行训练,以得到三违行为识别模型。
[0005]本公开第二方面实施例提出了一种煤矿三违行为识别模型训练装置,第一获取模块,用于获取非平衡率小于等于第一阈值的三违行为样本和安全行为样本,其中,每种样本至少包括以下指标:人员学历、工作年限、健康指标、作业时间、作业地点、作业班次、事件类型、上下井时间;聚类模块,用于对三违行为样本和安全行为样本进行聚类以得到多个候选聚类簇,并从多个候选聚类簇中筛选三违行为样本数量大于第二阈值的目标聚类簇;过采样模块,用于采用SMOTE算法对目标聚类簇进行过采样,以得到平衡样本数据集;以及训练模块,用于基于平衡样本数据集对目标模型进行训练,以得到三违行为识别模型。
[0006]本公开第三方面实施例提出了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开实施例的煤矿三违行为识别模型训练方法。
[0007]本公开第四方面实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开实施例公开的煤矿三违行为识别模型训练方法。
[0008]本实施例中,通过获取非平衡率小于等于第一阈值的三违行为样本和安全行为样
本,其中,每种样本至少包括以下指标:人员学历、工作年限、健康指标、作业时间、作业地点、作业班次、事件类型、上下井时间,对三违行为样本和安全行为样本进行聚类以得到多个候选聚类簇,并从多个候选聚类簇中筛选三违行为样本数量大于第二阈值的目标聚类簇,采用SMOTE算法对目标聚类簇进行过采样,以得到平衡样本数据集,以及基于平衡样本数据集对目标模型进行训练,以得到三违行为识别模型,能够训练识别模型以准确识别三违行为,保证煤矿开采的安全性;此外,本实施例在三违行为样本量少的情况下,可以对非平衡数据集进行平衡处理,有利于训练模型。
[0009]本公开附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。
附图说明
[0010]本公开上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0011]图1是根据本公开一实施例提供的煤矿三违行为识别模型训练方法的流程示意图;
[0012]图2是根据本公开另一实施例提供的煤矿三违行为识别模型训练方法的流程示意图;
[0013]图3是根据本公开另一实施例提供的煤矿三违行为识别模型训练装置的示意图;
[0014]图4示出了适于用来实现本公开实施方式的示例性电子设备的框图。
具体实施方式
[0015]为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
[0016]在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
[0017]需要说明的是,本实施例的煤矿三违行为识别模型训练方法的执行主体可以为煤矿三违行为识别模型训练装置,该装置可以由软件和/或硬件的方式实现,该装置可以配置在电子设备中,电子设备可以包括但不限于终端、服务器端等。
[0018]图1是根据本公开一实施例提供的煤矿三违行为识别模型训练方法的流程示意图,如图1所示,该方法包括:
[0019]S101:获取非平衡率小于等于第一阈值的三违行为样本和安全行为样本,其中,每种样本至少包括以下指标:人员学历、工作年限、健康指标、作业时间、作业地点、作业班次、事件类型、上下井时间。
[0020]其中,三违行为样本也可以被称为违规行为样本,指的是操作人员在煤矿作业过程中发生三违行为(违章指挥、违规作业、违反劳动纪律)的数据样本;对应的,安全行为样本,指的是煤矿作业过程中未发生三违行为的数据样本。
[0021]一些实施例,每条三违行为样本和安全行为样本至少包括:人员学历、工作年限、
健康指标(血压、血糖、血脂及其他表征人员身体健康程度的指标)、作业时间(对于三违行为样本则是三违行为发生时间)、作业地点(对于三违行为样本则是三违行为发生地点,例如,回采工作面、掘进工作面、工作面顺槽、运输巷道、机房硐室等)、作业班次(对于三违行为样本则是三违行为发生班次)、事件类型(对于三违行为样本则是三违行为事件类型,例如,不穿工作服、吸烟等)、上下井时间以及其它任意可能的指标,也即是说,每条样本(三违行为和安全行为)由上述指标构成,对此不作限制。
[0022]在实际应用中,为了便于模型训练,还可以对每条样本数据进行预处理。例如,将工作年限指标按照<2、2

5、5

8、>8年分成新手、胜任、精通、专家四级,划分标准根据定期专业技能考核结果实时更新;健康指标中根据指标范围,处于正常范围的记为0,依据超出指标的程度分别记为(

3、

2、

1、+1、+2、+3),

3代表远低于正常值、+3代表远高于正常值;根据上下井时间指标,统计下井人员前后一个月内的下井次数,连续下井天数、未来连续下井天数等,对此不作限制。
[0023]而非平衡率,表示三违行为样本数量与安全行为样本数量的比值,本公开实施例中,该非平衡率需要小于等于第一阈值,即本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种煤矿三违行为识别模型训练方法,其特征在于,包括:获取非平衡率小于等于第一阈值的三违行为样本和安全行为样本,其中,每种样本至少包括以下指标:人员学历、工作年限、健康指标、作业时间、作业地点、作业班次、事件类型、上下井时间;对所述三违行为样本和所述安全行为样本进行聚类以得到多个候选聚类簇,并从所述多个候选聚类簇中筛选三违行为样本数量大于第二阈值的目标聚类簇;采用SMOTE算法对所述目标聚类簇进行过采样,以得到平衡样本数据集;以及基于所述平衡样本数据集对目标模型进行训练,以得到三违行为识别模型。2.如权利要求1所述的方法,其特征在于,所述从所述多个候选聚类簇中筛选三违行为样本数量大于第二阈值的目标聚类簇之后,还包括:分别计算每个目标聚类簇中三违行为样本的稀疏度,并根据所述稀疏度确定每个目标聚类簇对应的权重值;计算每个目标聚类簇的权重值与待合成样本总数的乘积,作为所述目标聚类簇的待合成样本数;并且,所述采用SMOTE算法对所述目标聚类簇进行过采样,包括:采用SMOTE算法,分别基于所述待合成样本数对所述目标聚类簇进行过采样。3.如权利要求2所述的方法,其特征在于,所述计算每个目标聚类簇的权重值与待合成样本总数的乘积之前,还包括:获取预设的样本平衡率;以及计算所述安全行为样本数量与所述样本平衡率的乘积与所述三违行为样本数量的差值,作为所述待合成样本总数。4.如权利要求1所述的方法,其特征在于,所述对所述三违行为样本和所述安全行为样本进行聚类,包括:采用密度峰值聚类算法对所述三违行为样本和所述安全行为样本进行聚类。5.如权利要求1所述的方法,其特征在于,基于所述平衡样本数据集对目标模型进行训练,以得到三违行为识别模型,包括:基于所述平衡样本数据集对随机森林模型进行训练,以得到三违行为识别模型,其中,训练过程中在预设范围内不断调整基评估器数量的取值并进行10折交叉验证,直至模型精...

【专利技术属性】
技术研发人员:杨培培贾琨张晓霞邓院圆龚韩君
申请(专利权)人:煤炭科学研究总院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1