当前位置: 首页 > 专利查询>重庆大学专利>正文

一种电力设备状态监测数据聚类方法和系统技术方案

技术编号:25398896 阅读:76 留言:0更新日期:2020-08-25 23:04
本申请公开了一种电力设备状态监测数据聚类方法和系统,方法包括:获取待聚类的数据集X

【技术实现步骤摘要】
一种电力设备状态监测数据聚类方法和系统
本专利技术属于模式识别与异常检测
,特别是涉及一种电力设备状态监测数据聚类方法和系统。
技术介绍
电力设备是智能电网最重要的核心部分,它的正常运行是电网安全的根本保证。智能电网中的电力设备包括:大型电力变压器:输、配电网(架空线、电缆隧道);继保、控制设备,也可包括发电机等设备。随着网络技术、传感技术和计算机技术的快速发展,从最新智能电网的研究趋势分析,采用人工智能的方法对电力设备在线监测和状态维护已成为这一领域的发展潮流。DBSCAN(Density-BasedSpatialClusteringofApplicationswithNoise,简称密度聚类)模型在电力系统和电力设备状态监测数据的模式分类和异常检测领域具有广泛的应用。在DBSCAN模型中,邻域半径参数E和密度阈值参数k对DBSCAN模型的性能具有显著影响,但在缺乏数据标签的无监督条件下,不能使用交叉验证方法进行参数优化,而使用传统的基于k距离图的优化模型会使参数优化结果呈现较强的主观性和不准确性。为保证密度聚类模型的性能,本专利技术提出了一种基于密度聚类模型的电力设备状态监测方法和系统,旨在通过提升密度聚类模型对电力设备状态监测数据聚类结果的准确性和有效性,改进电力设备状态监测数据聚类。
技术实现思路
为解决现有技术中的不足,本申请提供一种电力设备状态监测数据聚类方法和系统,通过设计和绘制“类别数–E”曲线实现DBSCAN模型的邻域半径参数E和密度阈值参数k的优化,使模型性能得到显著提升,进而改进电力设备状态监测数据聚类。为了实现上述目标,本申请的第一件专利技术采用如下技术方案:一种电力设备状态监测数据聚类方法,所述方法包括以下步骤:步骤1:获取待聚类的电力设备在线监测数据集Xm×n,Xm×n包含m个样本,每个样本包含n类变量,对Xm×n中每个样本的n类变量进行标准化处理;步骤2:设置DBSCAN模型的密度阈值参数k;步骤3:根据标准化处理后Xm×n中每个样本与其余样本的距离绘制k距离图;步骤4:根据DBSCAN(0,k)模型对标准化处理后Xm×n进行聚类的聚类结果类别数,确定邻域半径参数E的下限阈值E0;步骤5:根据步骤3绘制的k距离图,确定邻域半径参数E的上限阈值Emax;步骤6:根据E0和Emax绘制“类别数–E”曲线;步骤7:根据“类别数–E”曲线确定邻域半径参数E的最优值;步骤8:使用步骤7形成的DBSCAN模型聚类电力设备在线监测数据,用于在线监测实时数据的模式识别和异常检测,判断正常数据类别与异常数据;DBSCAN是指基于密度聚类。优选地,步骤1中,对Xm×n中每个样本的n类变量分别进行z-score标准化处理,标准化公式为:式中,是第j类变量的第t个样本标准化后的量测值;和σj分别是第j类变量的平均值和标准差。优选地,步骤2中,设置DBSCAN模型的密度阈值参数k=2n。优选地,步骤3包括以下步骤:步骤3.1:计算标准化处理后Xm×n中每个样本与其余样本的距离;步骤3.2:计算每个样本与距离最近的k个样本的平均距离;步骤3.3:对m个平均距离值进行升序排序,以获得的升序排序序号作为横坐标,对应的m个平均距离值为纵坐标绘制k距离图。优选地,步骤3所述距离为欧式距离。优选地,步骤4中,DBSCAN(E,k)模型对标准化处理后Xm×n进行聚类的聚类结果类别数随着E值的增加而开始增加且大于N0时,此时的E值为E0,其中,N0为DBSCAN(0,k)模型聚类结果的类别数。优选地,步骤5中,在k距离图上找到纵坐标值为最大纵坐标值一半时的点,进一步找到该点附近k距离图上折线斜率变化最大的点,将该点的纵坐标确定为Emax。优选地,步骤6包括以下步骤:步骤6.1:在E0和Emax之间生成含有10个值的对数网格向量[E(1),E(2),E(3),…E(9),E(10)];其中E(1)=E0,E(10)=Emax;步骤6.2:在不同E(i)取值下使用DBSCAN(E(i),k)模型对标准化处理后Xm×n中的样本数据进行聚类,统计聚类类别数N(i),以E(i)为横坐标,对应的N(i)为纵坐标绘制“类别数–E”曲线,i=1,2,…,10。优选地,步骤7中,将“类别数–E”曲线中极大值右侧的第一个局部极小值点或是第一条水平线的左端点确定为邻域半径参数E的最优值。本申请还公开了另一件专利技术,即一种电力设备状态监测数据聚类系统,包括获取模块、设置模块、第一绘制模块、邻域半径参数下限阈值确定模块、邻域半径参数上限阈值确定模块、第二绘制模块和邻域半径参数最优值确定模块和数据聚类模块,其特征在于:所述获取模块,用于获取待聚类的电力设备在线监测数据集Xm×n,Xm×n包含m个样本,每个样本包含n类变量,对Xm×n中每个样本的n类变量进行标准化处理;所述设置模块,用于设置DBSCAN模型的密度阈值参数k;所述第一绘制模块,用于根据标准化处理后Xm×n中每个样本与其余样本的距离绘制k距离图;所述邻域半径参数下限阈值确定模块,用于根据DBSCAN(0,k)模型对标准化处理后Xm×n进行聚类的聚类结果的类别数,确定邻域半径参数E的下限阈值E0;所述邻域半径参数上限阈值确定模块,用于根据步骤3绘制的k距离图,确定邻域半径参数E的上限阈值Emax;所述第二绘制模块,用于根据E0和Emax绘制“类别数–E”曲线;所述邻域半径参数最优值确定模块,用于根据“类别数–E”曲线确定邻域半径参数E的最优值;数据聚类模块,使用邻域半径参数最优值确定模块确定的DBSCAN模型聚类力设备在线监测数据,用于在线监测实时数据的模式识别和异常检测,判断正常数据类别和异常数据。本申请所达到的有益效果:本申请通过设计和绘制“类别数–E”曲线实现DBSCAN模型的邻域半径参数E和密度阈值参数k的优化以及模型性能提升,可显著提升DBSCAN密度聚类模型对电力设备状态监测数据聚类结果和异常检测结果的准确性和有效性,为电力设备管理人员在进行原始数据清洗、设备故障检测与诊断时提供合理有效的数据分析结果,改进了电力设备状态监测数据聚类方法和系统。附图说明图1是本申请一种无监督条件下密度聚类模型的参数优化方法的流程图;图2是本申请实施例中的k距离图;图3是本申请实施例中的“类别数-E”曲线;图4是本申请实施例中用于性能评估的F度量计算结果。具体实施方式下面结合附图对本申请作进一步描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,而不能以此来限制本申请的保护范围。如图1所示,本申请的一种电力设备状态监测数据聚类方法,包括以下步骤:步骤1:获取一个含有101个异常值的变压器油中溶解气体在线监测数据集X780×6,该数本文档来自技高网...

【技术保护点】
1.一种电力设备状态监测数据聚类方法,其特征在于:/n所述方法包括以下步骤:/n步骤1:获取待聚类的电力设备在线监测数据集X

【技术特征摘要】
1.一种电力设备状态监测数据聚类方法,其特征在于:
所述方法包括以下步骤:
步骤1:获取待聚类的电力设备在线监测数据集Xm×n,Xm×n包含m个样本,每个样本包含n类变量,对Xm×n中每个样本的n类变量进行标准化处理;
步骤2:设置DBSCAN模型的密度阈值参数k;
步骤3:根据标准化处理后Xm×n中每个样本与其余样本的距离绘制k距离图;
步骤4:根据DBSCAN(0,k)模型对标准化处理后Xm×n进行聚类的聚类结果类别数,确定邻域半径参数E的下限阈值E0;
步骤5:根据步骤3绘制的k距离图,确定邻域半径参数E的上限阈值Emax;
步骤6:根据E0和Emax绘制“类别数–E”曲线;
步骤7:根据“类别数–E”曲线确定邻域半径参数E的最优值;
步骤8:使用步骤7形成的DBSCAN模型聚类电力设备在线监测数据,用于在线监测实时数据的模式识别和异常检测,判断正常数据类别与异常数据;
DBSCAN是指基于密度聚类。


2.根据权利要求1所述的电力设备状态监测数据聚类方法,其特征在于:
步骤1中,对Xm×n中每个样本的n类变量分别进行z-score标准化处理,标准化公式为:



式中,是第j类变量的第t个样本标准化后的量测值;和σj分别是第j类变量的平均值和标准差。


3.根据权利要求1所述的电力设备状态监测数据聚类方法,其特征在于:
步骤2中,设置DBSCAN模型的密度阈值参数k=2n。


4.根据权利要求1所述的电力设备状态监测数据聚类方法,其特征在于:
步骤3包括以下步骤:
步骤3.1:计算标准化处理后Xm×n中每个样本与其余样本的距离;
步骤3.2:计算每个样本与距离最近的k个样本的平均距离;
步骤3.3:对m个平均距离值进行升序排序,以获得的升序排序序号作为横坐标,对应的m个平均距离值为纵坐标绘制k距离图。


5.根据权利要求1或4所述的电力设备状态监测数据聚类方法,其特征在于:
步骤3所述距离为欧式距离。


6.根据权利要求1所述的电力设备状态监测数据聚类方法,其特征在于:
步骤4中,DBSCAN(E,k)模型对标准化处理后Xm×n进行聚类的聚类结果类别数随着E值的增加而开始增加且大于N0时,此时的E值为E0,其中,N0为DBSCAN(0,k)模型聚类结果的类...

【专利技术属性】
技术研发人员:王有元刘航陈伟根杜林李剑梁玄鸿周湶王飞鹏万福谭亚雄黄正勇
申请(专利权)人:重庆大学
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1