一种燃气管道事故的关联规则分析方法及系统技术方案

技术编号:39003447 阅读:13 留言:0更新日期:2023-10-07 10:35
本发明专利技术揭示了一种燃气管道事故的关联规则分析方法及系统,其方法包括:S100:获取待分析燃气管道事故文本;S200:构建命名实体识别模型并进行训练;S300:利用训练好的命名实体识别模型对待分析燃气管道事故文本进行结构化实体抽取,以获得事故文本的特征序列,以及对特征序列进行修正,获得最优实体识别结果;S400:基于所述最优实体识别结果进行关联规则分析,以获得关联规则分析结果。本发明专利技术能够降低现有关联规则算法的时间复杂度,能够提高挖掘效率以及实现燃气管道复杂环境下事故关联分析。分析。分析。

【技术实现步骤摘要】
一种燃气管道事故的关联规则分析方法及系统


[0001]本专利技术属于数据挖掘和关联分析
,具体涉及一种燃气管道事故的关联规则分析方法及系统。

技术介绍

[0002]随着城市化进程的加快,人们对于燃气的需求量越来越大,铺设的燃气管道也随之增多,一旦发生燃气管道事故,将会给人们的生命财产安全带来严重威胁。针对燃气管道事故的原因进行分析,寻找规律,才能更好地预防燃气管道事故的发生。
[0003]关联规则算法可以有效挖掘出事故因素间的客观规律,而当前的关联规则算法都是单一通过减少数据集扫描次数或减少冗余项集来减少算法耗时,且不能输出有效、可靠的关联规则结果。
[0004]此外,现有技术主要利用单支持度的传统或单一改进的关联规则算法进行关联分析,难以挖掘到小概率但重要的事故因素,时效性不高,本领域需要设计新型的关联规则算法用于燃气管道事故因素分析和挖掘。

技术实现思路

[0005]针对现有技术中的不足,本专利技术的目的在于提供一种燃气管道事故的关联规则分析方法,该方法能够在多支持度、多维度下进行燃气管道事故因素间的关联规则挖掘,不仅降低了算法的时间复杂度得到强关联规则,而且能够多维度的挖掘到燃气管道事故中小概率但重要的事故因素,为燃气管道事故预防提供技术支撑。
[0006]为实现上述目的,本专利技术提供以下技术方案:
[0007]一种燃气管道事故的关联规则分析方法,包括如下步骤:
[0008]S100:获取待分析燃气管道事故文本;
[0009]S200:构建命名实体识别模型并进行训练;
[0010]S300:利用训练好的命名实体识别模型对待分析燃气管道事故文本进行结构化实体抽取,以获得事故文本的特征序列,以及对特征序列进行修正,获得最优实体识别结果;
[0011]S400:基于所述最优实体识别结果进行关联规则分析,以获得关联规则分析结果,并基于分析结果给出燃气管道事故预防建议。
[0012]优选的,步骤S200中,所述命名实体识别模型包括:标签输入层、词向量生成层、特征提取层和序列优化层。
[0013]优选的,所述词向量生成层包括预训练网络,所述特征提取层包括融合的迭代膨胀卷积神经网络和双向长短期记忆网络,所述序列优化层包括条件随机场。
[0014]优选的,步骤S200中,所述命名实体识别模型的训练过程包括以下步骤:
[0015]S201:收集燃气管道历史事故文本并进行标注,将标注好的事故文本划分为训练集和验证集;
[0016]S202:设置模型参数,将训练集转换为向量后对模型进行训练,当训练达到最大迭
代次数后,模型训练完成;
[0017]S203:利用验证集对训练后的模型进行验证,在验证过程中,利用包括精确率、召回率和F1值在内的评价指标对模型进行评估,当达到预设评估值时,模型验证通过;否则调整模型参数重新对模型进行训练。
[0018]优选的,步骤S300包括以下步骤:
[0019]S301:在事故文本中插入标签;
[0020]S302:将插入标签后的事故文本转化为富含上下文语义的动态词向量;
[0021]S303:提取事故文本中的局部特征和全局特征,以获得特征序列。
[0022]S304:对特征序列进行修正优化。
[0023]优选的,步骤S400中,采用基于散列技术和索引翻转的关联规则算法对最优实体识别结果进行关联规则分析。
[0024]本专利技术还提出一种燃气管道事故的关联规则分析系统,包括:
[0025]获取模块,用于获取待分析燃气管道事故文本;
[0026]构建模块,用于构建命名实体识别模型并进行训练;
[0027]获取模块,用于利用训练好的命名实体识别模型对待分析燃气管道事故文本进行结构化实体抽取,以获得事故文本的特征序列,并对特征序列进行修正,以获得最优实体识别结果;
[0028]分析模块,用于基于所述最优实体识别结果进行关联规则分析,以获得关联规则分析结果。
[0029]优选的,所述抽取模块包括:
[0030]转化子模块,用于将事故文本转化为富含上下文语义的动态词向量;
[0031]提取子模块,用于提取事故文本中的局部特征和全局特征,以获得特征序列;
[0032]修正子模块,用于对所述特征序列进行修正,获得最优实体识别结果。
[0033]本专利技术还提出一种电子设备,包括:
[0034]存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,
[0035]所述处理器执行所述程序时实现如前任一所述的方法。
[0036]本专利技术还提出一种计算机存储介质,所述计算机存储介质存储有计算机可执行指令,所述计算机可执行指令用于执行如前任一所述的方法。
[0037]与现有技术相比,本专利技术带来的有益效果为:
[0038]本专利技术能够解决现有的关联规则算法运行过程中扫描事务数据集次数多、产生较多的候选项集、产生过多无用的规则和难以挖掘到燃气管道事故中小概率但重要的事故因素的不足,降低了算法时间复杂度,提高了挖掘效率,实现了燃气管道复杂环境下事故关联分析,为燃气管道事故预防提供技术支撑。
附图说明
[0039]图1是本专利技术一个实施例提供的一种燃气管道事故的关联规则的流程图;
[0040]图2是本专利技术另一个实施例提供的预训练网络的结构图;
[0041]图3是本专利技术另一个实施例提供的利用预训练网络获得动态词向量的示意图;
[0042]图4是本专利技术另一个实施例提供的燃气管道事故因素结构化抽取框架图;
[0043]图5是本专利技术另一个实施例提供的传统关联规则算法流程图;
[0044]图6是本专利技术另一个实施例提供的燃气管道事故因素关联规则挖掘流程图。
具体实施方式
[0045]下面将参照附图1至图6详细地描述本专利技术的具体实施例。虽然附图中显示了本专利技术的具体实施例,然而应当理解,可以通过各种形式实现本专利技术而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本专利技术,并且能够将本专利技术的范围完整的传达给本领域的技术人员。
[0046]需要说明的是,在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可以理解,技术人员可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名词的差异作为区分组件的方式,而是以组件在功能上的差异作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”或“包括”为一开放式用语,故应解释成“包含但不限定于”。说明书后续描述为实施本专利技术的较佳实施方式,然所述描述乃以说明书的一般原则为目的,并非用以限定本专利技术的范围。本专利技术的保护范围当视所附权利要求所界定者为准。
[0047]为便于对本专利技术实施例的理解,下面将结合附图以具体实施例为例做进一步的解释说明,且各个附图并不构成对本专利技术实施例的限定。
[0048]一个实施例中,如图1所示本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种燃气管道事故的关联规则分析方法,其特征在于,包括如下步骤:S100:获取待分析燃气管道事故文本;S200:构建命名实体识别模型并进行训练;S300:利用训练好的命名实体识别模型对待分析燃气管道事故文本进行结构化实体抽取,以获得事故文本的特征序列,对特征序列进行修正,获得最优实体识别结果;S400:基于所述最优实体识别结果进行关联规则分析,以获得关联规则分析结果。2.根据权利要求1所述的方法,其特征在于,步骤S200中,所述命名实体识别模型包括:标签输入层、词向量生成层、特征提取层和序列优化层。3.根据权利要求2所述的方法,其特征在于,所述词向量生成层包括预训练网络,所述特征提取层包括融合的迭代膨胀卷积神经网络和双向长短期记忆网络,所述序列优化层包括条件随机场。4.根据权利要求1所述的方法,其特征在于,步骤S200中,所述命名实体识别模型的训练过程包括以下步骤:S201:收集燃气管道历史事故文本并进行标注,将标注好的事故文本划分为训练集和验证集;S202:设置模型参数,将训练集转换为向量后对模型进行训练,当训练达到最大迭代次数后,模型训练完成;S203:利用验证集对训练后的模型进行验证,在验证过程中,利用包括精确率、召回率和F1值在内的评价指标对模型进行评估,当达到预设评估值时,模型验证通过;否则调整模型参数重新对模型进行训练。5.根据权利要求1所述的方法,其特征在于,步骤S300包括以下步骤:S301:在事故文本中插入标签;S...

【专利技术属性】
技术研发人员:宗涛刘云川李劲涛易军周伟陈凯
申请(专利权)人:重庆泓宝科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1