【技术实现步骤摘要】
一种铁路事故故障关联和事故故障原因分析方法及系统
本专利技术涉及铁路安全
,尤其涉及一种铁路事故故障关联和事故故障原因分析方法及系统。
技术介绍
铁路运输安全是一个复杂的安全系统工程,其事故故障之间存在着相关关联、相互影响的耦合关系。但一方面,由于对于铁路事故故障数据存在故障描述多样、缺乏标准术语的不足。例如,关于电务信号设备故障中的“道岔无表示”故障,就同时存在“道岔定位无表示”、“道岔反位无表示”、“道岔定位失表”、“道岔失表”、“道岔反位失表示”等多种表述情况,导致在数据分析时,容易将同一事故故障作为多个事故故障进行分析,造成分析结果的不准确。目前,针对多种描述的数据,可以通过计算不同故障名称的距离来计算其对统一事故故障的描述是否一样,但是传统计算文本相似性距离均需要依赖文本描述基本相同且无法构建文本与文本之间的关系来获取,依然无法克服对于铁路事故故障数据描述多样性的不足。另一方面,智能推荐相关的主流算法主要有基于内容推荐、基于关联规则推荐、基于效用推荐以及协同过滤推荐等。其中,基于内容的推荐(Content-basedRecommendation)是信息过滤技术的延续与发展,它是建立在项目的内容信息上作出推荐的,虽然不需要依据用户对项目的评价意见,但更多地需要用机器学习的方法从关于内容的特征描述的事例中得到用户的兴趣资料。基于关联规则推荐可以发现不同商品在销售过程中的相关性,它一般采用最近邻技术,利用用户的历史喜好信息计算用户之间的距离,然后利用目标用户的最近邻居用户对商品评价的加权评价 ...
【技术保护点】
1.一种铁路事故故障关联和事故故障原因分析方法,其特征在于,包括:/n构建铁路事故故障知识图谱;/n基于所述铁路事故故障知识图谱,对所有的事故故障名称以及所有的事故故障原因进行名称归一化后,进行统一编码,获取事故故障及原因编号表;/n将所述事故故障及原因编号表输入至ItemCF-IUF协同过滤分析模型,生成原因相似度矩阵;基于所述原因相似度矩阵,获取与每个所述事故故障名称相对应的最可能事故故障原因推荐;/n将所述事故故障及原因编号表输入至UserCF-IIF协同过滤分析模型,生成事故故障相似度矩阵;并基于所述事故故障相似度矩阵,获取每个事故故障原因导致的事故故障集合。/n
【技术特征摘要】
1.一种铁路事故故障关联和事故故障原因分析方法,其特征在于,包括:
构建铁路事故故障知识图谱;
基于所述铁路事故故障知识图谱,对所有的事故故障名称以及所有的事故故障原因进行名称归一化后,进行统一编码,获取事故故障及原因编号表;
将所述事故故障及原因编号表输入至ItemCF-IUF协同过滤分析模型,生成原因相似度矩阵;基于所述原因相似度矩阵,获取与每个所述事故故障名称相对应的最可能事故故障原因推荐;
将所述事故故障及原因编号表输入至UserCF-IIF协同过滤分析模型,生成事故故障相似度矩阵;并基于所述事故故障相似度矩阵,获取每个事故故障原因导致的事故故障集合。
2.根据权利要求1所述的铁路事故故障关联和事故故障原因分析方法,其特征在于,所述构建铁路事故故障知识图谱,包括:
将历史铁路事故故障及事故故障原因文本数据集划分为多个相互关联的事故故障领域,并基于本体构建工具,将每个所述事故故障领域构建成为一个事故故障概念本体;
在每个所述事故故障概念本体下构建专业事故故障实体;
在每个所述专业事故故障实体下构建多个事故故障子实体;
在每个所述事故故障子实体下构建至少一个事故故障实例;
建立每个事故故障概念本体、每个所述事故故障实体、每个所述事故故障子实体以及每个所述事故故障实例之间的关联关系,获取所述铁路事故故障知识图谱。
3.根据权利要求2所述的铁路事故故障关联和事故故障原因分析方法,其特征在于,在所述构建铁路事故故障知识图谱之前,还包括:
对历史铁路文本数据进行数据预处理,所述历史铁路文本数据包括历史铁路事故故障文本数据和事故故障原因文本数据;
基于预处理后的历史铁路文本数据构建铁路专业词汇语料库;
利用中文分词工具对所述铁路专业词汇语料库进行中文分词处理,获取所述历史铁路事故故障及事故故障原因文本数据集。
4.根据权利要求1所述的铁路事故故障关联和事故故障原因分析方法,其特征在于,所述基于所述铁路事故故障知识图谱,对所有的事故故障名称以及所有的事故故障原因进行名称归一化后,进行统一编码,获取事故故障及原因编号表,包括:
基于所述铁路事故故障知识图谱,识别同一事故故障名称的不同描述名称,并将所述不同描述名称归一化为一个规范化事故故障名称;
将与所述规范化事故故障名称对应的所有事故故障原因归纳至所述规范化事故故障名称下,且不同的故障原因用符号隔开;
对所述规范化事故故障名称和与其对应的所有事故故障原因进行统一编号,获取事故故障及原因编号表。
5.根据权利要求1所述的铁路事故故障关联和事故故障原因分析方法,其特征在于,所述将所述事故故障及原因编号表输入至ItemCF-IUF协同过滤分析模型,生成原因相似度矩阵;基于所述原因相似度矩阵,获取与每个所述事故故障名称相对应的最可能事故故障原因推荐,包括:
将所述事故故障及原因编号表输入至所述ItemCF-IUF协同过滤分析模型,获取每个所述事故故障原因的原因相似度,生成所述原因相似度矩阵;
基于所述原因相似度矩...
【专利技术属性】
技术研发人员:王同军,薛蕊,杨连报,李新琴,董兴芝,李平,马小宁,王万齐,马志强,刘军,吴艳华,邹丹,王喆,代明睿,张晓栋,程智博,赵冰,
申请(专利权)人:中国铁道科学研究院集团有限公司电子计算技术研究所,北京经纬信息技术有限公司,中国铁道科学研究院集团有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。