当前位置: 首页 > 专利查询>湘潭大学专利>正文

基于GG聚类与改进SVDD的接触网健康状态识别方法技术

技术编号:34265773 阅读:43 留言:0更新日期:2022-07-24 14:53
本发明专利技术公开了一种基于GG聚类与改进SVDD的接触网健康状态识别方法,主要针对由于接触网大部分数据为无监督学习数据,导致接触网检测数据利用率低,导致无法快速地对接触网的整个健康状态做出客观的识别的问题,本发明专利技术采用TSNE数据降维方法将高维数据降至低维空间中进行分析,剔除原始数据中的冗余信息,减少分析难度和干扰,提高识别准确性,并采用适合不规则数据分布类型的GG聚类算法,解决不同参数在类别划分中的影响程度不同导致聚类数据的分布改变的问题,最后将检测到的满足条件的异常数据输入GWO

Catenary health status recognition method based on GG clustering and improved SVDD

【技术实现步骤摘要】
基于GG聚类与改进SVDD的接触网健康状态识别方法


[0001]本专利技术涉及到铁路接触网的在线检测和故障诊断
,具体涉及到一种基于GG聚类与改进SVDD的接触网健康状态识别方法。

技术介绍

[0002]随着我国电气化铁路建设的飞速发展,全国架设电气化铁路的里程迅速增加,而电气化铁路的正常运行,离不开牵引供电系统,其中最为关键的设备便是接触网。接触网是电气化铁路所特有的一种供电线路,接触网结构组成、工作方式都非常复杂,通常沿铁轨上空架设,露天布置,且容易受到机车受电弓的高速冲击,因此也是电气化铁路牵引供电系统中的薄弱环节,接触网一旦发生故障,将直接导致弓网之间电流电压传输中断,导致列车晚点或者停运,对社会经济发展和人民的生命安全都会造成很大的威胁和损失。
[0003]大部分情况下,接触网的健康状态检测数据会在一定的范围内产生波动,这种波动恰恰反映了接触网状态的一种变化规律,接触网状态的任何异常都将导致检测到的参数数据无法反映这种规律。通过对接触网关键特征数据的分析与评估,可以了解接触网的运行是否处于良好状态。面对中国电力机车的日益提速,对接触网要求也越来越严格和苛刻。然而,接触网的健康状态识别并不是一项简单的工作,这需要通过一系列检测参数来反映。因此,对电气化铁路接触网进行在线检测和健康状态识别研究,确保铁路运输正常高效进行,具有十分重要的社会意义。

技术实现思路

[0004]本专利技术的目的就是为了解决传统接触网检测方式由于接触网大部分数据为无监督学习数据,导致接触网检测数据利用率低,无法对多个参数共同作用导致的接触网故障进行检测,并导致无法快速地对接触网的整个健康状态做出客观的识别的问题,提出了一种基于GG聚类与GWO

SVDD识别模型的接触网健康状态识别方法,对接触网各种参数及其相互之间的关系进行全面准确地检测,准确地识别出接触网的健康状态。
[0005]为达到上述目的,本专利技术采用如下技术方案:
[0006]本专利技术采用聚类的方法对数据进行处理,并通过改进的支持向量数据描述模型来识别接触网健康状态。首先,采集接触网运行参数的数据,包括导高、拉出值、硬点、接触压力、跨内高差、跨距等参数,并采用TSNE降维方法将数据维度降至2维,为后续聚类过程提供数据基础;其次,对降维后的数据采用Gath

Geva聚类方法进行聚类,并通过评价指标得到最优聚类数;接着,采用GWO

ISVDD识别模型构建超球体,使球内包含尽可能多的正常数据,球外为尽可能多的异常数据,并对接触网的健康状态进行识别。
[0007]具体步骤如下:
[0008]步骤1:建立接触网变压器健康状态评估指标体系。具体包括:接触网安全指标、接触线平顺指标、弓网受流性能指标与接触网历史运行情况等定量型指标;天气状况等定性型指标。
[0009]步骤2:根据接触网所处位置及环境,对接触网进行数据采集。采用激光采集传感器等传感器采集静态监测参数的相关数据,主要包括:拉出值、接触线高度、侧面限界、线索张力、接触压力等数据,并采集历史运行记录和天气数据。
[0010]步骤3:为了确定各类指标对接触网健康状态的影响程度,需要计算指标权重,权重系数越大说明其对接触网健康状态影响程度越高。本专利技术采用博弈论组合赋权确定权重分配。
[0011]步骤4:对接触网的检测数据进行预处理,根据接触网运行规程,将各指标的检测数据做归一化处理,消除不同参数不同量纲带来的不利影响。
[0012]步骤5:数据降维。采用TSNE对接触网检测数据进行降维,剔除源数据中的冗余信息,减小分析难度,并使数据可视化,从而直观发现数据的变化情况。
[0013]步骤6:GG聚类。将降维后的数据采用GG聚类方法聚类,利用PC指标与CE指标确定最佳聚类数目。
[0014]步骤7:建立GWO

SVDD识别模型。利用有标签样本数据建立GWO算法优化的SVDD性能退化识别模型,使得正常数据尽可能多包含于超球体模型内,异常数据尽可能多位于超球体模型外。
[0015]步骤8:待测样本分析。将待测样本输入到步骤7中建立的GWO

SVDD识别模型中,计算各类样本数据到球心的距离,并与超球体的半径作比较。
[0016]步骤9:接触网健康状态识别。对接触网待测样本数据进行分析,按照设置的健康指标范围,完成接触网健康状态识别。
[0017]本专利技术的有益效果是:
[0018]1)本专利技术对接触网运行数据采用TSNE数据降维和可视化方法,接触网的运行数据包括导高、拉出值、硬点、接触压力、跨内高差等数据,采用TSNE数据降维方法将高维数据降至低维空间中进行分析并使数据可视化,可以剔除原始数据中的冗余信息,减少分析难度和干扰,提高识别准确性,并可以使数据可视化,从而直观发现数据的变化情况。
[0019]2)本专利技术针对接触网参数众多,不同参数在类别划分中的影响程度不同导致聚类数据的分布改变的问题,采用适合不规则数据分布类型的GG聚类算法。
[0020]3)本专利技术采用GWO算法对SVDD模型中的参数进行寻优,确定最优核函数宽度与惩罚系数,避免因参数设置不准确而影响超球体的建立,提高接触网健康状态识别的准确性。
附图说明
[0021]图1为本专利技术方法的结构框图
[0022]图2为本专利技术方法的具体实施过程框图
[0023]图3为本专利技术中接触网采集数据预处理的实现框图
[0024]图4为GWO优化SVDD识别模型流程图
具体实施方式
[0025]下面结合附图对本专利技术做一个详细的说明。
[0026]图1为基于GG聚类与改进SVDD的接触网健康状态识别方法的结构框图。首先建立合理、科学的接触网健康状态识别指标体系,然后对接触网进行多源数据采集,包括:导高、
拉出值、接触线高度、侧面限界、接触压力、历史运行情况、天气数据,然后采用博弈论组合赋权确定权重分配,并对采集到的数据进行预处理,将各指标的检测数据做归一化处理,消除不同参数不同量纲带来的不利影响,再对接触网检测数据进行降维,剔除源数据中的冗余信息,减小分析难度,并使数据可视化,将降维后的数据进行聚类,然后利用有标签样本数据建立GWO算法优化的SVDD接触网健康状态识别模型,对接触网的健康状态进行识别,根据不同接触网健康状态识别结果,给出相对应的运维策略,方便检修人员进行检修。
[0027]图2为基于GG聚类与改进SVDD的接触网健康状态识别方法的实现流程。本方法的实现流程主要包括三个部分:健康状态识别、异常数据检测、GWO优化SVDD。首先对接触网进行多源数据采集,并对采集到的多源数据进行预处理,根据接触网运行规程,将各指标的监测数据做归一化处理,然后采用TSNE数据降维方法将高维数据降至低维空间中进行分析并使数据可视化,再通过GG聚类方法进行聚类,并通过评价指标得到最优聚类数,将检测到的满足条件的异常数据输入GWO...

【技术保护点】

【技术特征摘要】
1.本发明公开了一种基于GG聚类与改进SVDD的接触网健康状态识别方法,主要针对由于接触网大部分数据为无监督学习数据,导致接触网检测数据利用率低,导致无法快速地对接触网的整个健康状态做出客观的识别的问题,本发明采用TSNE数据降维方法将高维数据降至低维空间中进行分析,剔除原始数据中的冗余信息,减少分析难度和干扰,提高识别准确性,并采用适合不规则数据分布类型的GG聚类算法,解决不同参数在类别划分中的影响程度不同导致聚类数据的分布改变的问题,最后将检测到的满足条件的异常数据输入GWO

SVDD识别模型对数据进行分析,准确地识别出接触网的健康状态,具体步骤如下:步骤1:建立接触网变压器健康状态评估指标体系。具体包括:接触网安全指标、接触线平顺指标、弓网受流性能指标与接触网历史运行情况等定量型指标;天气状况等定性型指标。步骤2:根据接触网所处位置及环境,对接触网进行数据采集。采用激光采集传感器等传感器采集静态监测参数的相关数据,主要包括:拉出值、接触线高度、侧面限界、线索张力、接触压力等数据,并采集历史运行记录和天气数据。步骤3:为了确定各类指标对接触网健康状态的影响程度,需要计算指标权重,权重系数越大说明其对接触网健康状态影响程度越高。本发明采用博弈论组合赋权确定权重分配。步骤4:对接触网的检测数据进行预处理,根据接触网运行规程,将各指标的检测数据做归一化处理,消除不同参数不同量纲带来的不利影响。步骤5:数据降维。采用TSNE对接触网检测数据进行降维,剔除源数据中的冗余信息,减小分析难度,并使数据可视化,从而直观发现数据的变化情况。步骤6:GG聚类。将降维后的数据采用GG聚类方法聚类,利用PC指标与CE指标确定最佳聚类数目。步骤7:建立GWO

SVDD识别模型。利用有标签样本数据建立GWO算法优化的SVDD健康状态识别模型,使得正常数据尽可能多包含于超球体模型内,异常数据尽可能多位于超球体模型外。步骤8:待测样本分析。将待测样本输入到步骤7中建立的GWO

SVDD识别模型中,计算各类样本数据到球心的距离,并与超球体的半径作比较。步骤9:接触网健康状态识别。对接触网待测样本数据进行分析,按照设置的健康指标范围,完成接触网健康状态识别。2.基于权利要求1中所述的采用TSNE数据降维方法将高维数据降至低维空间中进行分析,剔除原始数据中的冗余信息,减少分析难度和干扰,其特征在于:由于接触网各参数之间的线性相关程度均较低,因此,基于线性的降维方法无法很好地适用于接触网健康状态识别。本发明采用TSNE对接触网检测数据进行降维,剔除源数据中的冗余信息,减小分析难度,并使数据可视化,从而直观发现数据的变化情况。假设高维数据集为X={x1,x2,

,x
n
},对应低维空间中的映射集为Y={y1,y2,

,y
n
},则高维空间中的条件概率与低维空间中的条件概率分别表示为:
其中,p
i|j
为高维空间中x
i
与x
j
的条件概率,且p
i|j
=p
j|i
;q
i|j
为低维空间中y
i
和y
j
的条件概率,且q
i|j
=q
j|i
;σ
j
为高斯分布的标准差。在高维空间中采用联合概率密度p
...

【专利技术属性】
技术研发人员:易灵芝禹果刘江永孙涛陈智勇董腾飞
申请(专利权)人:湘潭大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1