一种基于数据挖掘的煤矿风险预防和救援决策系统技术方案

技术编号:29521965 阅读:18 留言:0更新日期:2021-08-03 15:07
本发明专利技术提供一种基于数据挖掘的煤矿风险预防和救援决策的系统,将先进的数据挖掘技术应用于矿井中各种数据处理,然后采用SVM分类进行预测模型的构建,进而去预测风险,并采取相应措施去避险。救援决策方向采用预训练好的BERT中文模型,将各种成功的救援情况和方案去对BERT进行微调,然后根据情况给出措施。只要在训练模型时候有对应的事故数据,此发明专利技术可以针对各种风险去进行防护。相比于之前的单种煤矿风险预测系统,此系统能够对多种风险进行防护,而且加入了救援决策的功能使系统既能安全预防也可以成功的救援。

【技术实现步骤摘要】
一种基于数据挖掘的煤矿风险预防和救援决策系统
本专利技术涉及一种基于数据挖掘的煤矿风险预防和救援决策系统,属于数据挖掘领域和煤矿安全领域。
技术介绍
我国是一个资源比较丰富的地方,尤其是煤矿资源。相对于煤矿的其他地方,矿井内又是一个最为危险的地方,产生危险的因素主要有:瓦斯、顶板、运输、冲击地压、火灾、水害、机电等。煤矿事故对人民的生命和财产造成了严重的损失,我们可以发现在矿井中出现事故的因素有很多种,所以实时监测这些因素的一个数值,然后去进行预测可以让系统做出相应防护。在现有的预防技术中,只能针对一个特定的事故去进行一个预测,现实中只做一种预防远远不能够满足人们的安全生产需求。随着科技发展引入智能高效的风险预防和应对已经发生危险正确处理救援决策的系统是必然趋势,也只有这样才可以保证高质量的生产。
技术实现思路
针对现有预防技术的不足,本专利技术的目的是提供一种基于数据挖掘的煤矿风险预防和救援决策的系统,将先进的数据挖掘技术应用于矿井中各种数据处理,然后采用SVM分类进行预测模型的构建,进而去预测风险,并做出相应预防来杜绝危险,救援决策方向采用预训练好的BERT中文模型,将各种成功的救援情况和方案去对BERT进行微调,然后根据情况给出措施。实现本专利技术采用的技术方案是:本专利技术采用了Pearson积矩系数做相关性检测去除数据冗余,决策树特征提取和SVM分类模型的数据挖掘技术和分类算法手段去完成风险预防阶段的任务,然后针对发生的事故去使用微调好BERT模型,给出措施,具体按照下面步骤进行:(1)风险防护模块:第一步数据收集过程:在煤矿的生产中矿井中的各种属性值都量化成了数值属性,我们先将之前的所有这些数据都收集起来,为分析做准备。第二步专家标注类标签:将收集到的数据给专家分析,让专家对这些数据进行分类,为了之后我们训练系统做准备。第三步数据规范化过程:由于数值属性大小不一,会加重我们的分析负担。所以采用最小-最大规范化公式:其中minA,maxA是属性A的最小值和最大值,把A值vi映射到区间[new_minA,new_maxA]中的vi'。第四步相关性分析去冗余:对于数值属性,我们通过计算属性A和B的Pearson积矩系数公式:其中n是元祖个数,ai和bi分别是元组在A和B上的值,和分别是A和B的均值,σA和σB分别是A和B的标准差。第五步决策树进行特征选择:设置一个属性选择的最小阈值只要满足这个阈值就将这个属性保留。主要的选择指标有信息熵公式:D表示当前的数据集合,k表示当前数据集合的第k类,也就是我们目标变量的类型。将导致风险的属性进行保留,信息增益公式:Gain(D,A)=H(D)-H(D|A),其中基于特征A数据集D的划分,H(D|A):表示基于特征A(分类后)的信息熵。Di:基于特征A对数据集D划分的子集。考虑到特征分类子集的数据量不同,给每个子集赋予了权重。n:为特征A的分类总数,即有多少个Di。基于目标分类对特征类别Di数据集的划分:Dik:每个特征分类子集Di中目标分类后的子集。K:为目标分类的类别总数,即有多少个Dik。每个特征分类子集中,各目标分类子子集所占比例。第六步避免连锁事故发生寻找各事故之间的频繁因素:将上一步选择出来导致事故发生的因素进行一个整合之后,开始挖掘这些事故的频繁因素,然后对于这些挖掘出来的频繁因素进行更加严格的监控,避免连锁事故的发生。在寻找频繁因素的时候主要使用的是Apriori先验算法,是通过计算A和B事件的支持度公式:support=P(A∪B),指事件A和B同时发生的概率,还有置信度这2个公式完成挖掘。第七步SVM训练模型:SVM支持向量机,主要针对小样本数据、非线性及高维模式识别中表现出许多特有的优势,而且有很好的泛化能力。所以我们此处采用SVM去训练此系统的分类器。此处主要是使用了高斯核函数公式:K(xi,xj)=exp(-γ||xi-xj||2)去进行一个高维的投影,然后在高维空间寻找到一个分割面,在映射到低维空间。(2)救援决策模块:第一步成功救援数据收集:将历史上各种救援成功的文档进行收集,其中内容要求要有各种现场情况和如何救援的方案。第二步数据处理:将收集到的文档数据进行划分,主要就是将每一种现场情况和每一种救援进行摘取出来,放入表格里面不同的列,为下一步做准备。第三步中文BERT模型微调:首先BERT是采用了transformer的encode部分去进行组合的一个自然语言处理深度学习模型。而transformer中最为重要的是self-attention机制,计算公式是:其中Q,K,V是将输入的一个词向量通过矩阵变换成了3部分。然后再利用处理好的文字数据去微调预训练好的模型就可得到最终的模型。第四步救援决策给出:使用者对系统述说现在情况,系统给出救援方案去帮助做出最优的救援方案。本专利技术的有益效果是:(1)传统的风险防护,仅仅能够针对一种风险去做预防,但是这个系统可以针对多种风险去进行防护,只要你有对应的数据去训练出每种风险对应SVM模型就可以去做防护。而且较之前仅有的风险预测,现在添加了救援决策模块以应对发生大的事故。(2)将先进的数据挖掘技术应用于矿井中各种数据处理,然后采用SVM分类进行预测模型的构建,进而去预测风险,并做出相应预防杜绝危险,救援决策方向采用预训练好的BERT中文模型,将各种成功的救援情况和方案去对BERT进行微调,然后根据情况给出措施。附图说明图1是该系统软件的模块图。图2是该系统软件的用例图。图3是该系统进行风险预测的流程图。图4是该系统进行决策的流程图。具体实施方式下面将结合本专利技术实施例中的附图,进行具体说明。我们这个系统的模块图如图1所示,它主要是由三部分大模块组成,分别是:生成模型模块,风险预防模块,救援决策模块。其中生成模型模块的工作是生成一个预测模型去判断是否会有风险,在其中数据处理模块列举了三种风险,其实他可以适用各种风险只要有数据和类标签;风险预防模块的工作是获取实时数据,然后利用上一步获取的模型去做一个风险预测起到及时规避风险的作用;救援决策模块的工作是就是针对现场情况将如何进行救援的方案给出。然后分别展示了每个大模块下面的子模块,它们之间相互配合完成整个系统的工作。如图2是此系统的一个用例图,就是展示了此系统的使用者分别去使用此系统的一个功能体现。简单而言此系统针对3部分人群,首先就是构建系统的技术人员,他首先根据每一部分的所要完成的工作去对系统进行一个构造,还负责系统在之后使用过程中的更新功能,以及使用者的一个权限管理,使得他们只能够完成属于自己的那一部分操作,以免因误操作使系统出现错误而导致发生事故;员工主要就是负责将系统的一个监测器去打开,让系统去实时的获取需要监控的数值,然后系统的风险防护功能去判别是否会有风险发生,进而去做一个及时的处理;领导主要就是使用系统的一个决策功能,也就是在发生事故之后本文档来自技高网...

【技术保护点】
1.一种基于数据挖掘的煤矿风险预防和救援决策系统,其特征在于:生成模型模块,风险预防模块,救援决策模块。/n

【技术特征摘要】
1.一种基于数据挖掘的煤矿风险预防和救援决策系统,其特征在于:生成模型模块,风险预防模块,救援决策模块。


2.根据权利要求1所述基于数据挖掘的煤矿风险预防和救援决策系统,其特征在于:风险预防的方法其中还包含了生成模型的过程按照下面步骤进行:
第一步数据收集过程:在煤矿的生产中矿井中的各种属性值都量化成了数值属性,我们先将之前的所有这些数据都收集起来,为分析做准备。
第二步专家标注类标签:将收集到的数据给专家分析,让专家对这些数据进行分类,为了之后我们训练系统做准备。
第三步数据规范化过程:由于数值属性大小不一,会加重我们的分析负担。所以采用最小-最大规范化公式:其中minA,maxA是属性A的最小值和最大值,把A值vi映射到区间[new_minA,new_maxA]中的v′i。
第四步相关性分析去冗余:对于数值属性,我们通过计算属性A和B的Pearson积矩系数公式:其中n是元祖个数,ai和bi分别是元组在A和B上的值,和分别是A和B的均值,σA和σB分别是A和B的标准差。
第五步决策树进行特征选择:设置一个属性,选择的最小阈值只要满足这个阈值就将这个属性保留。主要的选择指标有信息熵公式:D表示当前的数据集合,k表示当前数据集合的第k类,也就是我们目标变量的类型。
将导致风险的属性进行保留,信息增益公式:Gain(D,A)=H(D)-H(D|A),其中基于特征A数据集D的划分,H(D|A):表示基于特征A(分类后)的信息熵。
第六步避免连锁事故发生寻找各事故之间的频繁因素:将上一步选择出来的导致事故发生的因素进行一个整合之后,开始挖掘这些事故的频繁因素,然后对于这些挖掘出来的频繁因素进行更加严格的监控,避免连锁事故的发生。在寻找频繁因素的时候主要使用的是Apri...

【专利技术属性】
技术研发人员:李冀苏步宇罗笑南李芳吕智张敏蓝晓霞
申请(专利权)人:桂林慧谷人工智能产业技术研究院
类型:发明
国别省市:广西;45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1