【技术实现步骤摘要】
一种电力设备状态监测数据聚类方法和系统
本专利技术属于模式识别与异常检测
,特别是涉及一种电力设备状态监测数据聚类方法和系统。
技术介绍
电力设备是智能电网最重要的核心部分,它的正常运行是电网安全的根本保证。智能电网中的电力设备包括:大型电力变压器:输、配电网(架空线、电缆隧道);继保、控制设备,也可包括发电机等设备。随着网络技术、传感技术和计算机技术的快速发展,从最新智能电网的研究趋势分析,采用人工智能的方法对电力设备在线监测和状态维护已成为这一领域的发展潮流。DBSCAN(Density-BasedSpatialClusteringofApplicationswithNoise,简称密度聚类)模型在电力系统和电力设备状态监测数据的模式分类和异常检测领域具有广泛的应用。在DBSCAN模型中,邻域半径参数E和密度阈值参数k对DBSCAN模型的性能具有显著影响,但在缺乏数据标签的无监督条件下,不能使用交叉验证方法进行参数优化,而使用传统的基于k距离图的优化模型会使参数优化结果呈现较强的主观性和不准确性。为保证密度聚类模型的性能,本专利技术提出了一种基于密度聚类模型的电力设备状态监测方法和系统,旨在通过提升密度聚类模型对电力设备状态监测数据聚类结果的准确性和有效性,改进电力设备状态监测数据聚类。
技术实现思路
为解决现有技术中的不足,本申请提供一种电力设备状态监测数据聚类方法和系统,通过设计和绘制“类别数–E”曲线实现DBSCAN模型的邻域半径参数E和密度阈值参数k的优化,使模型 ...
【技术保护点】
1.一种电力设备状态监测数据聚类方法,其特征在于:/n所述方法包括以下步骤:/n步骤1:获取待聚类的电力设备在线监测数据集X
【技术特征摘要】
1.一种电力设备状态监测数据聚类方法,其特征在于:
所述方法包括以下步骤:
步骤1:获取待聚类的电力设备在线监测数据集Xm×n,Xm×n包含m个样本,每个样本包含n类变量,对Xm×n中每个样本的n类变量进行标准化处理;
步骤2:设置DBSCAN模型的密度阈值参数k;
步骤3:根据标准化处理后Xm×n中每个样本与其余样本的距离绘制k距离图;
步骤4:根据DBSCAN(0,k)模型对标准化处理后Xm×n进行聚类的聚类结果类别数,确定邻域半径参数E的下限阈值E0;
步骤5:根据步骤3绘制的k距离图,确定邻域半径参数E的上限阈值Emax;
步骤6:根据E0和Emax绘制“类别数–E”曲线;
步骤7:根据“类别数–E”曲线确定邻域半径参数E的最优值;
步骤8:使用步骤7形成的DBSCAN模型聚类电力设备在线监测数据,用于在线监测实时数据的模式识别和异常检测,判断正常数据类别与异常数据;
DBSCAN是指基于密度聚类。
2.根据权利要求1所述的电力设备状态监测数据聚类方法,其特征在于:
步骤1中,对Xm×n中每个样本的n类变量分别进行z-score标准化处理,标准化公式为:
式中,是第j类变量的第t个样本标准化后的量测值;和σj分别是第j类变量的平均值和标准差。
3.根据权利要求1所述的电力设备状态监测数据聚类方法,其特征在于:
步骤2中,设置DBSCAN模型的密度阈值参数k=2n。
4.根据权利要求1所述的电力设备状态监测数据聚类方法,其特征在于:
步骤3包括以下步骤:
步骤3.1:计算标准化处理后Xm×n中每个样本与其余样本的距离;
步骤3.2:计算每个样本与距离最近的k个样本的平均距离;
步骤3.3:对m个平均距离值进行升序排序,以获得的升序排序序号作为横坐标,对应的m个平均距离值为纵坐标绘制k距离图。
5.根据权利要求1或4所述的电力设备状态监测数据聚类方法,其特征在于:
步骤3所述距离为欧式距离。
6.根据权利要求1所述的电力设备状态监测数据聚类方法,其特征在于:
步骤4中,DBSCAN(E,k)模型对标准化处理后Xm×n进行聚类的聚类结果类别数随着E值的增加而开始增加且大于N0时,此时的E值为E0,其中,N0为DBSCAN(0,k)模型聚类结果的类...
【专利技术属性】
技术研发人员:王有元,刘航,陈伟根,杜林,李剑,梁玄鸿,周湶,王飞鹏,万福,谭亚雄,黄正勇,
申请(专利权)人:重庆大学,
类型:发明
国别省市:重庆;50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。