一种基于聚类集成的转辙机故障识别方法技术

技术编号:19746357 阅读:45 留言:0更新日期:2018-12-12 04:56
一种基于聚类集成的转辙机故障识别方法,步骤如下,第一步:转辙机功率数据预处理:使用DTW动态时间归整处理转辙机功率数据;第二步:数据特征集与基聚类算法搭配生成基聚类成员:采用基于层次的凝聚式层次聚类和基于密度的DBSCAN、DPCA作为基聚类算法得到3个基聚类成员;第三步:构建基于聚类集成算法的转辙机故障数据挖掘框架,采用一种基于权重投票的W‑VOTE聚类集成算法,生成转辙机故障数据的分析、挖掘与故障诊断。本发明专利技术在无需先验知识前提下,具有故障诊断更全面、故障识别精度更高、故障识别可视化的特点。

【技术实现步骤摘要】
一种基于聚类集成的转辙机故障识别方法
本专利技术属于轨道交通运行控制
,涉及一种基于聚类集成的转辙机故障识别方法。
技术介绍
转辙机是高铁信号设备的重要组成,转辙机的正常运行保障着高铁的行车安全。电动转辙机广泛应用于我国高速铁路,工作地点位于室外,属于故障发生概率较高的信号设备。在现有技术中,对转辙机的故障诊断与维护,现场使用的诊断措施有:(1)人工周期性检验,依靠现场维护人员的工作经验定期进行检验,对转辙机故障的判断和处理效率有限。人工周期性检验方法,劳动强度大,故障识别效率低下,故障处理延时较长,无法适应当今铁路的高速发展要求。(2)传统故障诊断方法,例如基于模型、基于状态、基于专家系统、贝叶斯网络、支持向量机等故障诊断方法,这些方法均需要丰富完备的先验知识来支撑。传统故障诊断方法,大程度依靠先验知识,由于道岔广泛分布在铁路沿线,外界环境和工作条件差别巨大,导致故障模式和故障原因多样,很难全面地将所有故障进行诊断。(3)现有的基于监测系统的转辙机故障诊断方法的智能化程度较低,存在误诊、漏诊的情况,诊断效率低,在实际应用中需要现场人员的介入,现场人员的专业素养和经验对诊断结果有较大影响。
技术实现思路
本专利技术的目的是针对现有技术中存在的问题而提供一种对电动转辙机故障诊断更全面、故障识别精度更高的基于聚类集成的转辙机故障识别方法。本专利技术所采用的技术方案是:一种基于聚类集成的转辙机故障识别方法,包括以下步骤:(一):转辙机功率数据预处理由于天气情况、地理位置、启动时刻等外界环境因素的影响,转辙机每次动作的时长不同,使用DTW动态时间归整处理转辙机功率数据,完成原始功率数据的预处理。设时间序列X和Y的归整路径为W=(w1,w2,...,wK),其中max(|X|,|Y|)≤K≤|X|+|Y|,其中,K为聚类数目,wk=(i,j)是归整路径上的第k个元素,表示xi与yj建立的匹配关系;归整路径从w1=(1,1)开始,到wK=(|X|,|Y|)结束,保证X、Y中的每个坐标都出现,且i和j必须为单调递增,即式(1)点对匹配关系中,点对基距离Dbase(i,j)的和的最小值就是DTW距离,此时相应的归整路径即最佳路径,DTW距离表示为式(2)构造一个m行n列的累积距离矩阵D,如式(3)所示,求得最佳路径下,两个时间序列的归整路径距离(二):特征数据集与基聚类算法搭配生成基聚类成员为了集合各个聚类算法的优势,增强聚类集成的实用性,采用基于层次的凝聚式层次聚类和基于密度的DBSCAN、DPCA作为基聚类算法;凝聚式层次聚类、DBSCAN和DPCA算法均是根据样本间的距离,即相似度进行聚类,因此,使用DTW算法对转辙机原始功率数据集进行预处理,能够计算转辙机功率曲线间的真实距离,无需额外降维步骤,得到3个基聚类成员;(三):构建基于聚类集成算法的转辙机故障数据挖掘框架根据基聚类结果设计一种基于权重投票的W-VOTE聚类集成方法;通过分析基聚类结果,得到每一个基聚类成员对特定某几类故障类型有较好的聚类效果,并且所有基聚类成员各自聚类效果较好的类簇,能够覆盖全部故障模式以及正常模式;据此,设计不同基聚类成员在集成投票中的权重,通过反馈循环,当损失函数值最小时,确定权重的最佳取值;使用投票算法作为聚类集成方法的前提是所有基聚类成员的标签匹配,即代表同一类的标签相同;对于三种基聚类算法得到的3个基聚类成员,存在标签不匹配问题,需要完成对标签的转化;任取一个基聚类成员作为基准,计算其余基聚类成员得到的所有类与基准中的各个类之间重叠样本的数目,数目最大的两个类相互对应,将基聚类成员中的标签更改为基准标签,完成标签转化;上述基于权重投票的W-VOTE算法即投票算法具体步骤如下:输入:聚类数目K和基聚类成员标签矩阵cls;第一步:cls通过标签转化得到类别统一的标签矩阵Label;第二步:初始化权重q1,q2的值;第三步:通过加权投票得到此时的集成标签矩阵cl;第四步:计算此时损失函数的值L;第五步:令q1=q1+Δq1,q2=q2+Δq2;第六步:判断q1,q2是否在取值范围内;若是,则跳到第三步;若否,则向下执行第七步;第七步:寻找L的最小值,提取对应的权重q1,q2,以及对应的集成标签cl;第八步:输出cl,完成W-VOTE算法;上述q1、q2的值通过损失函数确定,损失函数的表达式见式(4)L(P,f(q1,q2))=|P-f(q1,q2)|(4)其中,P表示聚类效果最优时的准确率,即为1;f(q1,q2)表示当权重取q1,q2时,投票算法集成基聚类成员得到的最终聚类集成结果准确率;通过反馈循环,当损失函数值最小时,q1,q2为最佳取值,此时W-VOTE算法能得到最佳集成结果。与现有的技术比较,本专利技术的优点有以下几点:(1)提高故障识别精度:聚类是一种机器学习算法,具有学习能力,能够发现新的故障类型,聚类集成方法对基聚类成员进行集成,能够融合单一聚类的优势。本专利技术所提出的针对转辙机功率数据特点设计的基于权重投票的W-VOTE聚类集成算法,对转辙机的故障识别能达到较高的准确率。(2)对先验知识依赖度低:获取丰富完整的高速铁路领域的先验知识难度较大,而本专利技术使用的聚类集成是一种无监督学习方法,无需先验知识,能够有效区分无标签数据,解决了现有转辙机故障诊断方法中很大程度依赖先验知识、效率低下、故障处理延时较长的问题。(3)基于DTW提取的标量故障特征符合转辙机故障的内在相关性,更有利于实现高效的特征距离聚类:转辙机动作的功率监测曲线与其故障模式相关,同类型故障下的功率曲线相似度高,不同类型故障下的功率曲线相似度低。基于该领域知识,将DTW算法引入转辙机功率曲线的相似度计算,以曲线间的相似度标量作为特征距离进行故障聚类,实现了故障特征提取与数据降维合二为一,提高了转辙机功率数据聚类分析的可解释性和准确性。(4)诊断结果可视化:通过聚类集成方法,能够将转辙机功率数据集展示为散点图,代表同类故障的数据样本点聚合,不同故障的数据样本点分散,能够更加清晰直观地呈现转辙机故障结果。附图说明图1是转辙机故障数据挖掘整体框架图。图2是集成结果与故障模式对应图。图3是W-VOTE算法整体流程图。图4是W-VOTE聚类集成结果散点图。具体实施方式本专利技术利用转辙机的监测功率数据,构造基于聚类集成的转辙机故障数据挖掘框架,采用多种基聚类算法生成基聚类成员,并通过集成算法完成转辙机故障类型识别。本专利技术包含如下几个关键步骤:第一:转辙机功率数据预处理转辙机功率原始数据的维度较高且不统一,不同功率曲线间存在时间轴上的错位,无法直接进行聚类分析。使用DTW动态时间归整处理转辙机功率数据,完成原始功率数据的预处理。由于天气情况、地理位置、启动时刻等外界环境因素的影响,转辙机每次动作的时长不同,同属相同转辙机工作模式的各条功率曲线,在时间轴上存在位移,对转辙机功率信号进行简单时间轴缩放或传统欧氏距离均无法准确表达不同功率曲线相似度。DTW是一种基于动态规划,能够有效衡量两个长度不等的时间序列之间的相似度的方法。设时间序列X和Y的归整路径为W=(w1,w2,...,wK),其中max(|X|,|Y|)≤K≤|X|+|Y|,wk=(i,j)是归整路径上的第k个元本文档来自技高网...

【技术保护点】
1.一种基于聚类集成的转辙机故障识别方法,其特征在于,包括以下步骤:(一):转辙机功率数据预处理由于天气情况、地理位置、启动时刻等外界环境因素的影响,转辙机每次动作的时长不同,功率监测曲线在时间轴上存在错位,但相同故障类型下的功率曲线具有较高的相似度,基于该领域知识,将DTW动态时间归整算法引入转辙机功率曲线的相似度计算,使用DTW处理转辙机功率数据,完成原始功率数据的预处理;设时间序列X和Y的归整路径为W=(W1,W2,…,WK),其中max(|X|,|Y|)≤K≤|X|+|Y|,其中,K为聚类数目,wk=(i,j)是归整路径上的第k个元素,表示xi与yj建立的匹配关系;归整路径从w1=(1,1)开始,到wK=(|X|,|Y|)结束,保证X、Y中的每个坐标都出现,且i和j必须为单调递增,即式(1)

【技术特征摘要】
1.一种基于聚类集成的转辙机故障识别方法,其特征在于,包括以下步骤:(一):转辙机功率数据预处理由于天气情况、地理位置、启动时刻等外界环境因素的影响,转辙机每次动作的时长不同,功率监测曲线在时间轴上存在错位,但相同故障类型下的功率曲线具有较高的相似度,基于该领域知识,将DTW动态时间归整算法引入转辙机功率曲线的相似度计算,使用DTW处理转辙机功率数据,完成原始功率数据的预处理;设时间序列X和Y的归整路径为W=(W1,W2,…,WK),其中max(|X|,|Y|)≤K≤|X|+|Y|,其中,K为聚类数目,wk=(i,j)是归整路径上的第k个元素,表示xi与yj建立的匹配关系;归整路径从w1=(1,1)开始,到wK=(|X|,|Y|)结束,保证X、Y中的每个坐标都出现,且i和j必须为单调递增,即式(1)点对匹配关系中,点对基距离Dbase(i,j)的和的最小值就是DTW距离,此时相应的归整路径即最佳路径,DTW距离表示为式(2)构造一个m行n列的累积距离矩阵D,如式(3)所示,求得最佳路径下,两个时间序列的归整路径距离(二):特征数据集与基聚类算法搭配生成基聚类成员为了集合各个聚类算法的优势,增强聚类集成的实用性,采用基于层次的凝聚式层次聚类和基于密度的DBSCAN、DPCA作为基聚类算法;凝聚式层次聚类、DBSCAN和DPCA算法均是根据样本间的距离,即相似度进行聚类,因此,使用DTW算法对转辙机原始功率数据集进行预处理,能够计算转辙机功率曲线间的真实距离,无需额外降维步骤,得到3个基聚类成员;(三):构建基于聚类集成算法的转辙机故障数据挖掘框架根据基聚类结果设计一种基于权重投票的W-VOTE聚类集成方法;通过分析基聚类结果,...

【专利技术属性】
技术研发人员:王小敏李孟澜张文芳郑启明
申请(专利权)人:西南交通大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1