一种故障过程因果关系文本转化为符号序列的方法技术

技术编号:25039887 阅读:25 留言:0更新日期:2020-07-29 05:31
本发明专利技术公开了一种故障过程因果关系文本转化为符号序列的方法,其特征在于,给出描述故障事件的6种典型因果关系,提出因果关系与故障过程基本结构的转化流程,方法围绕着关键字和因果关系组模式展开,通过模型的不断学习补充和丰富关键字和组模式,最终使方法具备将表示故障过程的因果关系文本转化为符号序列的能力,方法适合于计算机智能文本处理分析,可用于对包含因果关系的文本进行计算机处理,形成计算机可处理的符号序列。

【技术实现步骤摘要】
一种故障过程因果关系文本转化为符号序列的方法
本专利技术涉及因果文本智能处理,特别是涉及包含因果关系的文本进行计算机处理,形成计算机可处理的符号序列。
技术介绍
故障过程网络主要作用是描述系统故障过程中各事件及其之间的逻辑关系。但最为困难的是将系统故障过程转化为故障过程网络。通常情况下,系统故障过程是通过事故调查、现场人员叙述或者专家推断得到的。这些系统故障过程数据是一种非结构的、文本形式的信息。将系统故障过程的文本描述转化为规则化的,具有符号表示特征的模式,以便进一步处理成为了关键问题。这涉及到信息收集、知识提取、知识表示、知识规则化,进一步涉及到安全科学和故障过程网络理论。针对上述问题,专门研究了适合故障过程网络的文本因果关系提取方法用于研究系统故障过程描述文本的表示和分析。方法可将系统故障过程文本语言描述转化为完整的可表达该文本语义的符号序列,从而为故障过程网络的文本语义分析提供一种方法,以适合计算机对符号序列的智能处理。这里首先解释文中出现的概念:传递概率:原因事件可导致结果事件的概率。连接:表示事件之间的相互关系,连接具有方向,从原因事件指向结果事件,并蕴含传递概率。
技术实现思路
一种故障过程因果关系文本转化为符号序列的方法,其特征在于,给出描述故障事件的6种典型因果关系,提出因果关系与故障过程基本结构的转化流程,方法围绕着关键字和因果关系组模式展开,通过模型的不断学习补充和丰富关键字和组模式,最终使方法具备将表示故障过程的因果关系文本转化为符号序列的能力,方法适合于计算机智能文本处理分析,可用于对包含因果关系的文本进行计算机处理,形成计算机可处理的符号序列。在系统故障过程中主要蕴含了事件间的因果关系,分为如下6种。(1)单层传递结构:A→B,A事件导致B事件。A代表原因事件,B代表结果事件,同下。(2)多层传递结构:A→B→C,A事件导致B事件,B导致C事件。(3)归一与结构:A1∧A2∧…→B,多个原因事件A同时导致结果事件B。(4)归一或结构:A1∨A2∨…→B,多个原因事件A,至少有一个发生导致结果事件B。(5)分支与结构:A→B1∧B2∧…,原因事件A发生,同时产生多个结果事件。(6)分支或结构:A→B1∨B2∨…,原因事件A发生,产生多个结果事件中的一个或多个。上述关系在故障过程网络中表示如图1所示。从图1左侧可了解6种因果关系与故障过程网络基本结构的转化情况。根据权利要求1所述一种故障过程因果关系文本转化为符号序列的方法,其特征在于,对故障过程因果关系文本转化为符号序列的方法和定义,定义1故障过程网络基本结构:指由一个或多个原因事件,一跨连接和一个或多个结果事件组成的基本单元,即原因事件到结果事件经过一次连接的结构。故障过程网络用于描述系统故障过程,对于系统故障的分析是按照系统故障过程的逆序关系描述的,即从系统故障开始,按照连接的反方向找到各过程事件,最终找到故障起始事件。一般情况下系统故障过程使用语言描述的文本,如何将这些描述文本转化成可用于系统故障过程分析的故障过程网络是关键问题。故障过程网络中包括事件和连接及其逻辑关系。事件主要包括原因事件和结果事件;或分为故障起始事件、过程事件和系统故障。所涉及到的原因事件和结果事件逻辑关系主要是与或关系。那么在系统故障过程中提取这些信息,首先要对系统故障过程语言论述进行因果关系组划分;其次确定关键词;最后确定常用的因果关系组模式。定义2因果关系组:划分系统故障过程的描述文本后,每一个因果关系划分表达一个完整的因果关系描述,称为因果关系组,以“。”号分解最为简单,因果关系组也是因果关系分析的最基本单元。定义3因果关系组模式:利用关键字将一个因果关系组中的词汇符号化,形成可表示原因果关系组因果关系的符号序列。因果关系组模式是一类因果关系的抽象,是因果关系组表示为符号序列模板。来源于实际系统故障过程的多个因果关系组可能对应一个因果关系组模式。使用知识提取方法,将系统故障过程的描述文本转化为故障过程网络基本结构可分为三个阶段,图如2所示,包括模型研究、模型学习和实例分析。模型研究阶段主要是模型建立,通过系统故障过程因果关系分析,将系统故障过程的描述文本进行因果关系分解,从而对文本进行划分。划分后每一个因果关系划分表达一个完整的因果关系描述,称为因果关系组,以“。”号分解最为简单,因果关系组也是因果关系分析的最基本单元。在各个因果关系组转化为故障过程网络基本结构后,可根据因果关系组之间的相同事件叠加形成完整的故障过程网络,最终完成系统故障过程到故障过程网络转化。确定因果关系组后,对组内各部分进行分析,主要包括原因事件、结果事件及逻辑关系。可将文本抽象为连接词,原因词,结果词,原因部分,结果部分,标点符号,其他类型短语,称为关键词。在系统故障过程描述中这些词都有具体的词汇,可在模型学习过程中累计。逐渐形成这些关键词对应的词汇集合,以便丰富文本因果关系分析能力。根据因果关系组和得到的关键词集合,研究因果关系组的基本模式。由于已事先获得关键字,将因果关系组中的文本描述进行替换,可得到为数不多的因果关系组模式。每种模式都代表了一类因果关系描述类型的语句。该过程在模型学习阶段得到补充和丰富。将组模式转化为故障过程网络的基本结构。根据组模式转化为故障过程网络的对应结构。因此,关键词中的原因词和结果词引导的原因部分和结果部分将成为故障过程网络的节点对应事件。连接词代表了原因部分或结果部分之间的逻辑与或关系,将成为故障过程网络的连接和逻辑关系。其他类型短语一般成为原因和结果事件的一部分。最后得到的所有故障过程网络基本结构都只传递了一次,那么之中必定有事件即作为原因又作为结果,因此根据等事件规则将所有故障过程网络基本结构叠加,形成系统故障过程文本描述转化的完整故障过程网络结构。模型学习阶段主要是关键词和因果关系模式的补充和丰富。在已分析的系统故障过程文本中,可以获得一些关键词对应的词汇,也可确定因果关系模式。但关键词在语言中千变万化,一个关键词可以有很多词汇表示,需要实践中学习丰富。同理因果关系模式代表了一句完整的因果关系描述,这些描述的结构千变万化,也需不断补充。对于一个实例系统故障过程分析,如果他的关键词和关系模式都是已知的,那么将会顺利完成系统故障过程到故障过程网络的转化。如果关键词或因果关系模式不在集合中,非已知,那么对于模型而言是个学习过程,以丰富关键词和关系模式。在经过大量实例的学习后方法将达到成熟。为说明方便形成形式化表示结构,制定如下定义。定义4关键词(Keywords,KW):用于代表系统故障过程文本描述中,可进行形式化抽取和同类词汇表示,关键词是由表示相同含义的词汇组成的集合,由关键词组成的集合称为关键词组(Keywordsset,KWS)。KW是一类文本词汇的统一标识。用于在系统故障过程中因果关系组的抽象和形式化。将因果关系组代表的文本转化为因果关系组模式的符号序列。KW分为类型:连接词1、连接词2、原因词、结果词、原因部分、结果部分、其他关于本文档来自技高网...

【技术保护点】
1.一种故障过程因果关系文本转化为符号序列的方法,其特征在于,给出描述故障事件的6种典型因果关系,提出因果关系与故障过程基本结构的转化流程,方法围绕着关键字和因果关系组模式展开,通过模型的不断学习补充和丰富关键字和组模式,最终使方法具备将表示故障过程的因果关系文本转化为符号序列的能力,方法适合于计算机智能文本处理分析,可用于对包含因果关系的文本进行计算机处理,形成计算机可处理的符号序列。/n

【技术特征摘要】
1.一种故障过程因果关系文本转化为符号序列的方法,其特征在于,给出描述故障事件的6种典型因果关系,提出因果关系与故障过程基本结构的转化流程,方法围绕着关键字和因果关系组模式展开,通过模型的不断学习补充和丰富关键字和组模式,最终使方法具备将表示故障过程的因果关系文本转化为符号序列的能力,方法适合于计算机智能文本处理分析,可用于对包含因果关系的文本进行计算机处理,形成计算机可处理的符号序列。


2.根据权利要求1所述一种故障过程因果关系文本转化为符号序列的方法,其特征在于,对故障过程因果关系文本转化为符号序列的方法和定义,
定义1故障过程网络基本结构:指由一个或多个原因事件,一跨连接和一个或多个结果事件组成的基本单元,即原因事件到结果事件经过一次连接的结构,
定义2因果关系组:划分系统故障过程的描述文本后,每一个因果关系划分表达一个完整的因果关系描述,称为因果关系组,以“,”号分解,因果关系组也是因果关系分析的最基本单元,
定义3因果关系组模式:利用关键字将一个因果关系组中的词汇符号化,形成可表示原因果关系组因果关系的符号序列,因果关系组模式是一类因果关系的抽象,是因果关系组表示为符号序列模板,来源于实际系统故障过程的多个因果关系组可能对应一个因果关系组模式,
定义4关键词KW:用于代表系统故障过程文本描述中,可进行形式化抽取和同类词汇表示,关键词是由表示相同含义的词汇组成的集合,由关键词组成的集合称为关键词组KWS,KW是一类文本词汇的统一标识,用于在系统故障过程中因果关系组的抽象和形式化,将因果关系组代表的文本转化为因果关系组模式的符号序列,KW分为类型:连接词1、连接词2、原因词、结果词、原因部分、结果部分、其他关于和符号部分,这些KW组成了关键词组KWS,
定义5连接词1LW1:用于表示系统故障过程中,归一和分支结构的与关系,即多个原因事件同时发生导致结果事件,一个原因事件同时导致多个结果事...

【专利技术属性】
技术研发人员:李莎莎崔铁军
申请(专利权)人:辽宁工程技术大学
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1