一种基于大数据技术的二次设备隐患挖掘方法技术

技术编号:12862320 阅读:97 留言:0更新日期:2016-02-13 10:56
本发明专利技术的目的在于提供一种基于大数据技术的二次设备隐患挖掘方法,包含两个过程:基于二次设备历史数据的模型训练和异常样本辨识,其中模型训练步骤包括获取二次设备监测数据的特征矩阵、二次设备样本数据主成分分析以及计算可靠统计概率分布。所述异常样本辨识则基于样本状态评价模型,将某个设备某一段时间的监测样本进行计算和评价,并且给出相关的量化指标。本发明专利技术的方法能够及早的发现状态监测数据表面处于‘正常’的阶段,而已经处于缓慢的劣化趋势中的隐患设备。该方法对设备的表现的稳定性和异常程度有了量化的评价,克服了当前二次设备检修中无法正确掌握设备健康状态的不足,便于运维人员在二次设备故障之前及早发现隐患,缩小设备维修的范围,减小维修的成本。

【技术实现步骤摘要】

本专利技术涉及电力系统数据处理方法,具体是提出了针对电力系统一种基于大数据 技术的二次设备隐患挖掘方法。
技术介绍
电气设备根据功能不同,可分为一次设备和二次设备。电气二次设备主要包括继 电保护、自动装置、故障录波、就地监控和远动。它们正常可靠的运行是保障电网稳定和电 力设备安全的基本要求。随着微机在继电保护及自动装置的广泛应用,继电保护的可靠性、 定值整定的灵活性大大提高。 电力系统的二次设备的传统检修方法,一般是以时间为基础的,即不管设备的实 际状况如何,到期必修。它缺乏对设备的综合分析,并且由于多依靠手段落后的人工统计方 法来指导设备检修,往往不是检修过量,就是检修不足。而且定检试验过程复杂,试验时考 虑不周可能引起其它开关误动。在检修周期内保护异常不能及时发现。当前随着技术的发 展,出现了依靠监控系统和微机保护的智能报警,由常规的控制系统发出警报信号,然后现 场操作人员报警信号,并依据现场的经验来完成。当时这种模式存在的主要问题是,当设备 出现报警时要么是一些不太重要的告警,要么是设备已经严重损害的告警。而在设备的状 态监测数据表面处于"正常"的阶段中,设备已经处于缓慢的劣化进程,处于正常与故障的 隐患状态。 因此,急需一种对于设备的隐患状态发觉的方法,及时发现二次设备的隐患状态, 或识别二次设备向故障状态发展的趋势,从而为二次设备的状态检修提供有价值的信息。
技术实现思路
本专利技术的目的在于提供一种基于大数据技术的二次设备状态监测数据的隐患挖 掘方法,利用数据挖掘方法,从同种型号的二次设备在历史上积累的海量监测数据,找到设 备状态与监测数据之间的关系,及时发现二次设备的隐患状态,或识别二次设备向故障状 态发展的趋势,从而为二次设备的状态检修提供有价值的信息。 本专利技术的目的可通过以下的技术措施来实现: -种基于大数据技术的二次设备隐患挖掘方法,包含两个过程:基于二次设备历 史数据的模型训练和异常样本辨识。 其中,第一个过程包含获取二次设备监测数据的特征矩阵、二次设备样本数据主 成分分析、可靠统计概率分布,输出的模型为降维转换矩阵、映射矩阵和样本状态评价模 型。这些模型支撑异常样本的辨识过程。 第二个过程的降维转换、样本映射、样本辨识分别依赖于第一个过程中降维转换 矩阵、映射矩阵和样本状态评价模型。最终输出的异常样本辨识指标(包括异常程度指标 和稳定程度指标),作为对单台设备一段时间内监测数据的分析评估结果。 1)所述基于二次设备历史数据的模型训练步骤的具体内容如下: I. 1)获取二次设备监测数据的特征矩阵具体过程如下: 根据专业二次设备主要涉及变电站中合并单元、智能终端、保护测控装置、直流系 统、网络设备等二次设备的相关信息,而每类专业的检测指标是不同的,如离线信息、在线 信息、原始资料状态量、运行情况状态量、检修试验情况状态量等。在构造阶段还需要对各 类二次设备的不同的原始信息进行预处理和规范化,形成设备特征样本矩阵。在构造特征 样本矩阵时,将同一型号的不同设备,混排在样本数据的矩阵中,所述样本数据的矩阵如下 式所示: Rawdataj= (j = l,2"",N) (I) 式(2)中,Rawdataj代表第j条某个二次设备(编号为ID)在某个时刻T的状态 检测样本数据,该类二次设备有m个特征指标,依次构成监测特征数据。其中的监测特征数 据的特征矩阵为: Featurej= (j = l,2^..,N) (3) 同样,j为样本索引,m代表第m个特征指标,N表示样本数; 1. 2)二次设备样本数据主成分分析具体过程如下: 因数据挖掘往往涉及到向量、矩阵运算,而该类计算随着维数的增加,计算量呈指 数倍增长,即所谓的"维数灾"现象,而且构造的原始的样本数据的矩阵很多信息是重复与 冗余的,也不利于挖掘结果的可视化。二次设备样本数据主成分分析目标是在减少数据集 维数的同时,尽可能多地保留原数据集的信息。 假设一个数据集X = {xm},其中m = 1,2,…,M,而每个xm是一个N维的行向量。 主成分分析是将X映射到一个K维空间内,其中K的维度〈N,同时使保留下来的数据能最大 化表示原始数据集的信息。 将所述步骤1.1)中样本数据的监测数据的特征矩阵,经过主 成分分析后,生成降维后特征矩阵FEATURES+PCAj= ,即用k个主成分涵 盖原数据集绝大部分信息量,同时保存降维转换矩阵QT。 1. 3)计算可靠统计概率分布具体步骤如下: 生成将降维后特征矩阵FEATURES+PCAj= 后,需要统计概率分 布。分布的中心与形状分别由均值与协方差表示,是后续计算距离时的依据。但是由于均 值与协方差都极易受异常点的影响,因此需要一种能够排除异常点、可靠估计概率分布的 算法,算法步骤如下: 初始化:从降维特征矩阵FEATURES_PCA中随机抽取H个样本,其中 N/2 < H < 3N/4,计算其样本均值Tl和协方差矩阵Sl ; 样本偏离中心距离计算,这里计算公式如下: 其中Tl为样本均值和Sl为协方差矩阵。 迭代优化:从降维特征矩阵中选择对应马氏距离最小的H个样本,迭代计算其样 本均值T2和协方差矩阵S2,当满足det (S2) = det (SI)或det (S2) = O时,将Tl和SI分 别作为降维特征矩阵总体分布期望T和方差S的可靠估计。 将大量历史样本经过之前1)_3)步骤后的计算,得到样本状态评价模型,即:降维 特征矩阵总体分布期望T和方差S的可靠估计量,即基于马氏距离的期望T和方差S。其 中,该马氏距离服从自由度为K的卡方分布,当满足d > Clthrashcild时视为异常样本。 2)异常样本辨识的具体过程 异常样本辨识的目标是基于样本状态评价模型,将某个设备某一段时间的监测样 本进行计算和评价,并且给出相关的量化指标:异常程度及稳定程度。异常程度指标是指 反映设备在该时间段工况偏离正常状态的程度,稳定程度指标是反映该设备在该时间段的 表现是否稳定,是对异常程度的补充(比较典型的情况,某些设备,其异常程度指标即局部 均值可能是正常的,但是其局部方差是较大的,说明该设备可能处于正常与劣化的交界阶 段)。 2. 1)设定观察目标对象即二次设备的ID,及该二次设备的观测时间段,从 样本数据中取出满足条件的数据子集,作为待测样本; 2. 2)利用步骤1. 2)中生成的降维转换矩阵Qt对待测样本进行降维,得到降维后 的待测样本; 2. 3)利用步骤1. 3)中生成的协方差矩阵S作为映射矩阵,将降维后的待测样本投 影到总体样本空间,得到规范化的待测样本。 2. 4)计算规范化待测样本的局部均值与方差。将待测样本均值与步骤1. 3)迭代 优化后的总体样本均值进行距离计算作为异常程度指标值,将待测样本方差作为稳定程度 指标值。 本专利技术对比现有技术,有如下优点: 本专利技术的基于二次设备监测历史数据的隐患挖掘方法,及早的发现状态监测数据 表面处于'正常'的阶段,而已经处于缓慢的劣化趋势中的隐患设备。该方法基于历史监测 大数据,经过样本数据构造、主成分分析、距离计算、可靠统计概率分布和异常样本识别等 流程,对设备的表现的稳定性和异常程度有了量化的评价,克服了当前二次设本文档来自技高网...
一种基于大数据技术的二次设备隐患挖掘方法

【技术保护点】
一种基于大数据技术的二次设备隐患挖掘方法,其特征在于包含两个过程:基于二次设备历史数据的模型训练和异常样本辨识;1)所述基于二次设备历史数据的模型训练步骤的具体内容如下:1.1)获取二次设备监测数据的特征矩阵具体过程如下:对各类二次设备的不同的原始信息进行预处理和规范化,形成设备特征样本矩阵,其中,在构造特征样本矩阵时,将同一型号的不同设备,混排在样本数据的矩阵中,所述样本数据的矩阵如下式所示:Rawdataj=[ID T fj,1 fj,2 ... fj,m](j=1,2,…,N)     (1)式(2)中,Rawdataj代表第j条某个编号为ID的二次设备在某个时刻T的状态检测样本数据,该类二次设备有m个特征指标,依次构成监测特征数据;其中的监测特征数据的特征矩阵为:Featurej=[fj,1 fj,2 ... fj,m](j=1,2,…,N)    (3)同样,j为样本索引,m代表第m个特征指标,N表示样本数;1.2)所述二次设备样本数据主成分分析具体过程如下:将所述步骤1.1)中样本数据的监测数据的特征矩阵[fj,1 fj,2 ... fj,m],经过主成分分析,即将特征矩阵映射到一个K维空间内,其中K的维度<N,使保留下来的数据能最大化表示原始数据集的信息,并保存降维转换矩阵QT,生成降维后特征矩阵FEATURES_PCAj=[fj,1 fj,2 ... fj,k];1.3)可靠统计概率分布具体步骤如下:初始化:从降维特征矩阵FEATURES_PCA中随机抽取H个样本,其中N/2≤H≤3N/4,计算其样本均值T1和协方差矩阵S1;计算样本偏离中心距离:dj=(FEATURES_PCAj-T1)S1-1(FEATURES_PCAj-T1)T(j=1,2,...,N)---(4)]]>迭代优化:从降维特征矩阵中选择对应马氏距离最小的H个样本,迭代计算其样本均值T2和协方差矩阵S2,当满足det(S2)=det(S1)或det(S2)=0时,将T1和S1分别作为降维特征矩阵总体分布期望T和方差S的可靠估计;将大量历史样本经过之前1)‑3)步骤后的计算,得到样本状态评价模型,即:降维特征矩阵总体分布期望T和方差S的可靠估计量;2)所述异常样本辨识的具体过程如下:2.1)设定观察目标对象即二次设备的ID,及该二次设备的观测时间段[t1t2],从样本数据中取出满足条件的数据子集,作为待测样本;2.2)利用步骤1.2)中生成的降维转换矩阵QT对待测样本进行降维,得到降维后的待测样本;2.3)利用步骤1.3)中生成的协方差矩阵S作为映射矩阵,将降维后的待测样本投影到总体样本空间,得到规范化的待测样本;2.4)计算规范化待测样本的局部均值与方差:将待测样本均值与步骤1.3)迭代优化后的总体样本均值进行距离计算作为异常程度指标值,将待测样本方差作为稳定程度指标值。...

【技术特征摘要】

【专利技术属性】
技术研发人员:陶文伟李金胡荣郑志千史泽兵罗会洪
申请(专利权)人:中国南方电网有限责任公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1