一种基于隐患知识图谱的事故原因分析方法和系统技术方案

技术编号:35670809 阅读:31 留言:0更新日期:2022-11-23 14:05
本发明专利技术提供了一种基于隐患知识图谱的事故原因分析方法,包括如下步骤:构建领域词典,对领域词典中的语料进行分词并构建词向量集合和句向量集合;基于事故文本数据生成事故发生的事故时序图;建立隐患数据库,基于隐患数据库中的各种隐患文本数据建立隐患知识图谱;基于所述词向量集合、句向量集合、事故时序图和隐患知识图谱进行隐患相似度匹配,并进行隐患分类;基于隐患相似度匹配和分类结果进行事故原因分析,确定根本原因并生成事故报告。与目前仅人为分析事故原因相比,本发明专利技术的方法和系统能够指明事故调查分析的方向,并帮助用户更全面的找到发生事故的各类原因,以及这些原因的相关支撑隐患。因的相关支撑隐患。因的相关支撑隐患。

【技术实现步骤摘要】
一种基于隐患知识图谱的事故原因分析方法和系统


[0001]本专利技术涉及数据分析
,具体涉及一种基于隐患知识图谱的事故原因分析方法和系统。

技术介绍

[0002]工业企业的安全生产管理中,通过对安全生产事故的原因分析,能帮助企业避免事故重发、查找管理弱项、提升企业安全生产管理水平。但原因分析过于片面则仅能做到治标不治本,以某企业为例,2018年发生了1起灼烫伤事故、2起高处坠落事故、1起摔伤事故和1起起重伤害事故,虽然每起事故都做了调查分析和发布报告,但2019年又再次发生了5起同样分属于灼烫伤、高处坠落、摔伤、起重伤害的事故。因此企业需要对安全生产事故进行更全面更深入的原因分析,即根本原因分析(根本原因是指导致事物发生变化的根源或者导致事物发生变化的最本质的原因,是指引起事物发展变化的诸多原因中起关健作用、决定作用的最重要的原因)。目前根本原因分析的技术手段依赖于专业能力较高的安全管理人员或团队,他们通过对单一事故进行调查与分析,找到并解决发生事故的根本原因,来避免事故重发,但目前大部分企业中不具备这样的专业人员或团队,且培养具备根本原因分析能力的人员需要投入的人力以及时间成本较高,培训后人员对根本原因分析的掌握程度缺少保障。

技术实现思路

[0003]本专利技术所要解决的技术问题是针对上述问题提供一种基于隐患知识图谱的事故原因分析方法。
[0004]本专利技术的第一方面提供了一种基于隐患知识图谱的事故原因分析方法,包括如下步骤:
[0005]S1、构建领域词典,对领域词典中的语料进行分词并构建词向量集合和句向量集合;
[0006]S2、基于事故文本数据生成事故发生的事故时序图;
[0007]S3、建立隐患数据库,基于隐患数据库中的各种隐患文本数据建立隐患知识图谱;
[0008]S4、基于所述词向量集合、句向量集合、事故时序图和隐患知识图谱进行隐患相似度匹配,并进行隐患分类;
[0009]S5、基于隐患相似度匹配和分类结果进行事故原因分析,确定根本原因并生成事故报告。
[0010]进一步的,步骤S1中构建领域词典具体包括:
[0011]S11、收集并整理选定行业的隐患数据、事故事件以及管理制度各类语料,组建该行业的语料库;
[0012]S12、抽取部分语料内容组建所选行业的领域词典。
[0013]进一步的,步骤S1中基于所述领域词典进行分词并构建词向量集合和句向量集合
具体包括:
[0014]S13、基于分词算法对领域词典中的语料进行分词;
[0015]S14、使用word2vec对分词后的语料分别进行词向量化,并将词向量化后的词向量与安全词典向量匹配,选择靠近安全词典的词向量作为最终词向量构成词向量集合;
[0016]S15、利用词向量、位置信息、文本信息进行句向量生成,使用孪生和三级网络结构来获得语义上有意义的句子向量,完成句向量模型的构建与训练。
[0017]进一步的,步骤S2具体包括:
[0018]S21、基于事故文本数据中的时间、标点符或词性类别,将事故文本按照递进的发展方式分段呈现;
[0019]S22、提取事故原因和事故后果描述的关键词或高频词,构成事故核心实体;
[0020]S23、将所述事故核心实体以时序图的形式呈现。
[0021]进一步的,步骤S3具体包括:
[0022]S31、收集整理隐患数据,审查并剔除不合格数据后导入数据库;
[0023]S32、将数据库中的原始数据按照数据的结构化程度分为结构化数据、半结构化数据和非结构化数据;
[0024]S33、根据数据不同的结构化形式,将数据转换为三元组的形式并进行知识融合形成标准的数据表示;
[0025]S34、基于预设推理规则,产生隐含知识数据;
[0026]S35、将S33中得到的标准的数据表示和S34中得到的隐含知识数据输入图数据库形成隐患知识图谱。
[0027]进一步的,步骤S4中,进行隐患相似度匹配具体包括:
[0028]S41、识别所述事故时序图中异常事项的核心实体;
[0029]S42、将识别结果与所述隐患知识图谱中的隐患数据进行比对,获取与该异常事项关联的所有隐患文本数据。
[0030]进一步的,步骤S4中,进行隐患分类具体包括:
[0031]S43、确定隐患分类类别,并给隐患文本数据设置类别标签;
[0032]S44、基于预训练BERT模型并面向隐患事件分类任务进行微调作为隐患分类模型;
[0033]S45、对所述隐患分类模型进行训练、验证和测试,确定模型参数;
[0034]S46、使用训练好的分类模型对隐患文本数据进行隐患分类。
[0035]进一步的,步骤S5具体包括:
[0036]S51、根据隐患相似度匹配和分类结果,基于隐患知识图谱生成问答选项并获取用户确认结果;
[0037]S52、基于用户确认结果再次生成具有递进关系的下一个问题,同时根据用户确认结果生成原因因素,并按照层级的关系不断向外扩展;
[0038]S53、问答全部完成后,在最外层的原因因素中选定事故的根本原因,并将其余最外层的原因作为事故的促成因素;
[0039]S54、生成事故报告。
[0040]本专利技术的第二个方面提供了一种基于隐患知识图谱的事故原因分析系统,包括:
[0041]领域词典构建模块,用于对领域词典中的语料进行分词并构建词向量集合和句向
量集合;
[0042]事故时序图生成模块,用于基于事故文本数据生成事故发生的事故时序图;
[0043]隐患知识图谱生成模块,用于建立隐患数据库并基于隐患数据库中的各种隐患文本数据建立隐患知识图谱;
[0044]匹配分类模块,用于基于所述词向量集合、句向量集合、事故时序图和隐患知识图谱进行隐患相似度匹配,并进行隐患分类;
[0045]原因分析模块,用于基于隐患相似度匹配和分类结果进行事故原因分析,确定根本原因并生成事故报告。
[0046]本专利技术的有益效果:与目前仅人为分析事故原因相比,本专利技术的方法和系统能够指明事故调查分析的方向,并帮助用户更全面的找到发生事故的各类原因,以及这些原因的相关支撑隐患。
附图说明
[0047]图1为本专利技术的事故原因分析方法实施例的流程示意图。
[0048]图2为本专利技术实施例中知识图谱的建立流程示意图。
[0049]图3为本专利技术实施例中隐患分类类别示意图。
[0050]图4为本专利技术实施例中FBERT模型样式示意图。
[0051]图5为本专利技术实施例中句向量训练模型及相似度计算示意图。
具体实施方式
[0052]为了进一步理解本专利技术,下面结合实施例对本专利技术优选实施方案进行描述,但是应当理解,这些描述只是为进一步说明本专利技术的特征和优点,而不是对本专利技术权利要求的限制。
[0053]本专利技术第一种实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于隐患知识图谱的事故原因分析方法,其特征在于,包括如下步骤:S1、构建领域词典,对领域词典中的语料进行分词并构建词向量集合和句向量集合;S2、基于事故文本数据生成事故发生的事故时序图;S3、建立隐患数据库,基于隐患数据库中的各种隐患文本数据建立隐患知识图谱;S4、基于所述词向量集合、句向量集合、事故时序图和隐患知识图谱进行隐患相似度匹配,并进行隐患分类;S5、基于隐患相似度匹配和分类结果进行事故原因分析,确定根本原因并生成事故报告。2.如权利要求1所述的基于隐患知识图谱的事故原因分析方法,其特征在于,步骤S1中构建领域词典具体包括:S11、收集并整理选定行业的隐患数据、事故事件以及管理制度各类语料,组建该行业的语料库;S12、抽取部分语料内容组建所选行业的领域词典。3.如权利要求2所述的基于隐患知识图谱的事故原因分析方法,其特征在于,步骤S1中基于所述领域词典进行分词并构建词向量集合和句向量集合具体包括:S13、基于分词算法对领域词典中的语料进行分词;S14、使用word2vec对分词后的语料分别进行词向量化,并将词向量化后的词向量与安全词典向量匹配,选择靠近安全词典的词向量作为最终词向量构成词向量集合;S15、利用词向量、位置信息、文本信息进行句向量生成,使用孪生和三级网络结构来获得语义上有意义的句子向量,完成句向量模型的构建与训练。4.如权利要求3所述的基于隐患知识图谱的事故原因分析方法,其特征在于,步骤S2具体包括:S21、基于事故文本数据中的时间、标点符或词性类别,将事故文本按照递进的发展方式分段呈现;S22、提取事故原因和事故后果描述的关键词或高频词,构成事故核心实体;S23、将所述事故核心实体以时序图的形式呈现。5.如权利要求4所述的基于隐患知识图谱的事故原因分析方法,其特征在于,步骤S3具体包括:S31、收集整理隐患数据,审查并剔除不合格数据后导入数据库;S32、将数据库中的原始数据按照数据的结构化程度分为结构化数据、半结构化数据和非结构化数据;S33、根据数据不同的结构化形式,将数据转换为三...

【专利技术属性】
技术研发人员:汤凯骆宾蒋重文曾一鑫
申请(专利权)人:宁波欧依安盾安全科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1