一种铁路事故故障关联和事故故障原因分析方法及系统技术方案

技术编号:24331367 阅读:40 留言:0更新日期:2020-05-29 19:43
本发明专利技术实施例提供一种铁路事故故障关联和事故故障原因分析方法及系统,该方法包括:构建铁路事故故障知识图谱;基于铁路事故故障知识图谱,对所有的事故故障名称以及所有的事故故障原因进行名称归一化后,进行统一编码,获取事故故障及原因编号表;将事故故障及原因编号表输入至协同过滤分析模型,生成原因相似度矩阵;基于原因相似度矩阵,获取与每个事故故障名称相对应的最可能事故故障原因推荐;将事故故障及原因编号表输入至协同过滤分析模型,生成事故故障相似度矩阵;并基于事故故障相似度矩阵,获取每个事故故障原因导致的事故故障集合。本实施例通过融合知识图谱与推荐算法,提高了事故故障关联与原因分析的精准度,加强了铁路安全运行的保障。

A method and system of railway accident correlation and accident cause analysis

【技术实现步骤摘要】
一种铁路事故故障关联和事故故障原因分析方法及系统
本专利技术涉及铁路安全
,尤其涉及一种铁路事故故障关联和事故故障原因分析方法及系统。
技术介绍
铁路运输安全是一个复杂的安全系统工程,其事故故障之间存在着相关关联、相互影响的耦合关系。但一方面,由于对于铁路事故故障数据存在故障描述多样、缺乏标准术语的不足。例如,关于电务信号设备故障中的“道岔无表示”故障,就同时存在“道岔定位无表示”、“道岔反位无表示”、“道岔定位失表”、“道岔失表”、“道岔反位失表示”等多种表述情况,导致在数据分析时,容易将同一事故故障作为多个事故故障进行分析,造成分析结果的不准确。目前,针对多种描述的数据,可以通过计算不同故障名称的距离来计算其对统一事故故障的描述是否一样,但是传统计算文本相似性距离均需要依赖文本描述基本相同且无法构建文本与文本之间的关系来获取,依然无法克服对于铁路事故故障数据描述多样性的不足。另一方面,智能推荐相关的主流算法主要有基于内容推荐、基于关联规则推荐、基于效用推荐以及协同过滤推荐等。其中,基于内容的推荐(Content-basedRecommendation)是信息过滤技术的延续与发展,它是建立在项目的内容信息上作出推荐的,虽然不需要依据用户对项目的评价意见,但更多地需要用机器学习的方法从关于内容的特征描述的事例中得到用户的兴趣资料。基于关联规则推荐可以发现不同商品在销售过程中的相关性,它一般采用最近邻技术,利用用户的历史喜好信息计算用户之间的距离,然后利用目标用户的最近邻居用户对商品评价的加权评价值来预测目标用户对特定商品的喜好程度,从而根据这一喜好程度来对目标用户进行推荐。基于效用的推荐(Utility-basedRecommendation)是确是建立在对用户使用项目的效用情况上计算的,其核心问题是如何为每一个用户去创建一个效用函数。可以获知:上述智能推荐相关的算法在数据处理时,均对推荐对象存在特殊的要求,不能处理非结构化的复杂对象,因此运用于处理铁路事故故障关联和事故故障原因分析时,均存在多方面的不足。
技术实现思路
本专利技术实施例提供一种铁路事故故障关联和事故故障原因分析方法及系统,用以解决现有技术中无法克服对于铁路事故故障数据描述多样性的不足以及无法准确进行铁路事故故障关联和事故故障原因分析的缺陷。第一方面,本专利技术实施例提供一种铁路事故故障关联和事故故障原因分析方法,包括:构建铁路事故故障知识图谱;基于铁路事故故障知识图谱,对所有的事故故障名称以及所有的事故故障原因进行名称归一化后,进行统一编码,获取事故故障及原因编号表;将事故故障及原因编号表输入至ItemCF-IUF协同过滤分析模型,生成原因相似度矩阵;基于原因相似度矩阵,获取与每个事故故障名称相对应的最可能事故故障原因推荐;将事故故障及原因编号表输入至UserCF-IIF协同过滤分析模型,生成事故故障相似度矩阵;并基于事故故障相似度矩阵,获取每个事故故障原因导致的事故故障集合。进一步地,上述构建铁路事故故障知识图谱,包括:将历史铁路事故故障及事故故障原因文本数据集划分为多个相互关联的事故故障领域,并基于本体构建工具,将每个事故故障领域构建成为一个事故故障概念本体;在每个事故故障概念本体下构建专业事故故障实体;在每个事故故障实体下构建多个事故故障子实体;在每个事故故障子实体下构建至少一个事故故障实例;建立每个事故故障概念本体、每个事故故障实体、每个事故故障子实体以及每个事故故障实例之间的关联关系,获取铁路事故故障知识图谱。进一步地,在构建铁路事故故障知识图谱之前,还包括:对历史铁路文本数据进行数据预处理,历史铁路文本数据包括历史铁路事故故障文本数据和事故故障原因文本数据;基于预处理后的历史铁路文本数据构建铁路专业词汇语料库;利用中文分词工具对所述铁路专业词汇语料库进行中文分词处理,获取历史铁路事故故障及事故故障原因文本数据集。进一步地,上述基于所述铁路事故故障知识图谱,对所有的事故故障名称以及所有的事故故障原因进行名称归一化后,进行统一编码,获取事故故障及原因编号表,包括:基于铁路事故故障知识图谱,识别同一事故故障名称的不同描述名称,并将不同描述名称归一化为一个规范化事故故障名称;将与规范化事故故障名称对应的所有事故故障原因归纳至规范化事故故障名称下,且不同的故障原因用符号隔开;对规范化事故故障名称和与其对应的所有事故故障原因进行统一编号,获取事故故障及原因编号表。进一步地,上述将事故故障及原因编号表输入至ItemCF-IUF协同过滤分析模型,生成原因相似度矩阵;基于原因相似度矩阵,获取与每个事故故障名称相对应的最可能事故故障原因推荐,包括:将事故故障及原因编号表输入至所述ItemCF-IUF协同过滤分析模型,获取每个事故故障原因的原因相似度,生成原因相似度矩阵;基于原因相似度矩阵,获取每个事故故障与每个事故故障原因之间的原因关联度;获取与每个事故故障相对应的原因关联度最大的事故故障原因为最可能事故故障原因。进一步地,上述获取每个所述事故故障原因的原因相似度,包括:在Jaccard相似度计算公式的基础上,引进IUF进行修正;其中原因相似度计算公式为:其中,u表示事故故障,N(u)表示事故故障原因的数量,N(i)表示由编号为i的事故故障原因导致的事故故障数量,N(j)表示由事故故障原因j导致的事故故障数量,wi,j为编号为i的事故故障原因与事故故障原因j之间的原因相似度。进一步地,上述获取每个事故故障与每个事故故障原因之间的原因关联度的计算方法为:其中,S(j,k)是与事故故障原因j最相似的K个事故故障原因的集合,ru,i是事故故障u对事故故障原因i的原因关联度,pu,j为事故故障u与事故j的总原因关联度。进一步地,上述将事故故障及原因编号表输入至UserCF-IIF协同过滤分析模型,生成事故故障相似度矩阵;并基于事故故障相似度矩阵,获取每个事故故障原因导致的事故故障集合,包括:在余弦相似度计算公式的基础上,引进IIF进行修正,计算每个事故故障原因之间的事故相似度,生成事故故障相似度矩阵,其中故障相似度计算公式为:其中,u、v表示不同的事故故障,N(u)表示事故故障原因的数量,N(i)表示由编号为i的事故故障原因导致的事故故障数量,N(j)表示由事故故障原因j导致的事故故障数量,wi,j为编号为i的事故故障原因与事故故障原因j之间的原因相似度。第二方面,本专利技术实施例提供一种铁路事故故障关联和事故故障原因分析系统,包括:图谱构建模块、归一编码模块、事故故障原因分析模块以及故障关联模块,其中:图谱构建模块,用于根据历史铁路事故故障及事故故障原因文本数据集,构建铁路事故故障知识图谱。归一编码模块,用于基于铁路事故故障知识图谱,对所有的事故故障名称以及所有的事故故障原因进行名称归一化后,进行统一编码,获取事故故障及原因编号表。事故故障原因分析模块,用于将事故故障及原因编号表输入至ItemCF-IUF协同过滤分析模本文档来自技高网
...

【技术保护点】
1.一种铁路事故故障关联和事故故障原因分析方法,其特征在于,包括:/n构建铁路事故故障知识图谱;/n基于所述铁路事故故障知识图谱,对所有的事故故障名称以及所有的事故故障原因进行名称归一化后,进行统一编码,获取事故故障及原因编号表;/n将所述事故故障及原因编号表输入至ItemCF-IUF协同过滤分析模型,生成原因相似度矩阵;基于所述原因相似度矩阵,获取与每个所述事故故障名称相对应的最可能事故故障原因推荐;/n将所述事故故障及原因编号表输入至UserCF-IIF协同过滤分析模型,生成事故故障相似度矩阵;并基于所述事故故障相似度矩阵,获取每个事故故障原因导致的事故故障集合。/n

【技术特征摘要】
1.一种铁路事故故障关联和事故故障原因分析方法,其特征在于,包括:
构建铁路事故故障知识图谱;
基于所述铁路事故故障知识图谱,对所有的事故故障名称以及所有的事故故障原因进行名称归一化后,进行统一编码,获取事故故障及原因编号表;
将所述事故故障及原因编号表输入至ItemCF-IUF协同过滤分析模型,生成原因相似度矩阵;基于所述原因相似度矩阵,获取与每个所述事故故障名称相对应的最可能事故故障原因推荐;
将所述事故故障及原因编号表输入至UserCF-IIF协同过滤分析模型,生成事故故障相似度矩阵;并基于所述事故故障相似度矩阵,获取每个事故故障原因导致的事故故障集合。


2.根据权利要求1所述的铁路事故故障关联和事故故障原因分析方法,其特征在于,所述构建铁路事故故障知识图谱,包括:
将历史铁路事故故障及事故故障原因文本数据集划分为多个相互关联的事故故障领域,并基于本体构建工具,将每个所述事故故障领域构建成为一个事故故障概念本体;
在每个所述事故故障概念本体下构建专业事故故障实体;
在每个所述专业事故故障实体下构建多个事故故障子实体;
在每个所述事故故障子实体下构建至少一个事故故障实例;
建立每个事故故障概念本体、每个所述事故故障实体、每个所述事故故障子实体以及每个所述事故故障实例之间的关联关系,获取所述铁路事故故障知识图谱。


3.根据权利要求2所述的铁路事故故障关联和事故故障原因分析方法,其特征在于,在所述构建铁路事故故障知识图谱之前,还包括:
对历史铁路文本数据进行数据预处理,所述历史铁路文本数据包括历史铁路事故故障文本数据和事故故障原因文本数据;
基于预处理后的历史铁路文本数据构建铁路专业词汇语料库;
利用中文分词工具对所述铁路专业词汇语料库进行中文分词处理,获取所述历史铁路事故故障及事故故障原因文本数据集。


4.根据权利要求1所述的铁路事故故障关联和事故故障原因分析方法,其特征在于,所述基于所述铁路事故故障知识图谱,对所有的事故故障名称以及所有的事故故障原因进行名称归一化后,进行统一编码,获取事故故障及原因编号表,包括:
基于所述铁路事故故障知识图谱,识别同一事故故障名称的不同描述名称,并将所述不同描述名称归一化为一个规范化事故故障名称;
将与所述规范化事故故障名称对应的所有事故故障原因归纳至所述规范化事故故障名称下,且不同的故障原因用符号隔开;
对所述规范化事故故障名称和与其对应的所有事故故障原因进行统一编号,获取事故故障及原因编号表。


5.根据权利要求1所述的铁路事故故障关联和事故故障原因分析方法,其特征在于,所述将所述事故故障及原因编号表输入至ItemCF-IUF协同过滤分析模型,生成原因相似度矩阵;基于所述原因相似度矩阵,获取与每个所述事故故障名称相对应的最可能事故故障原因推荐,包括:
将所述事故故障及原因编号表输入至所述ItemCF-IUF协同过滤分析模型,获取每个所述事故故障原因的原因相似度,生成所述原因相似度矩阵;
基于所述原因相似度矩...

【专利技术属性】
技术研发人员:王同军薛蕊杨连报李新琴董兴芝李平马小宁王万齐马志强刘军吴艳华邹丹王喆代明睿张晓栋程智博赵冰
申请(专利权)人:中国铁道科学研究院集团有限公司电子计算技术研究所北京经纬信息技术有限公司中国铁道科学研究院集团有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1