一种基于主成分分析和k-means聚类的台区用户识别方法技术

技术编号:21091000 阅读:22 留言:0更新日期:2019-05-11 10:29
本发明专利技术涉及电力系统技术领域,公开了一种基于主成分分析和k‑means聚类的台区用户识别方法。包括:获取台区变压器低压侧及用户电表电压数据;对电压数据进行主成分分析,获取低维度分析对象;确定k‑means聚类个数k;计算待聚类对象数据密度,确定初始聚类质心;采用k‑means聚类算法对待聚类对象进行聚类,然后识别台区用户关系。采用本发明专利技术的方案,提高辨识可靠性、解决效率低且存在安全隐患的问题,并且降低了硬件和人工成本;通过降维技术把多维的电压数据化为较少的几个主成分来进行分析,从而降低了算法计算量,提高了算法效率;对常规的k‑means算法进行改进,能够准确有效地识别用户所属台区与相别,能够彻底解决跨台区用户归属难题。

【技术实现步骤摘要】
一种基于主成分分析和k-means聚类的台区用户识别方法
本专利技术涉及电力系统
,特别是一种基于主成分分析和k-means聚类的台区用户识别方法。
技术介绍
准确的基础台区档案是台区线损率分析、配网故障定位、抢修工单下发、三相不平衡分析等等一系列高级应用的重要基础。然而由于我国电力系统起步较晚、初期发展规划不完善,我国现阶段配电变压器分布散乱、配电线路错综复杂。同时,由于电网公司在多年的运营过程中信息记录遗失、更新不及时、信息不完整等原因,导致台区的档案资料往往不准确,即少部分终端用户存在台户真实挂接关系与台区档案不相符的现象。错乱的台区档案使多种高级应用无法有效开展,严重影响了电网公司建设智能电网的进程。因此,亟需高效、稳定、准确的台区拓扑辨识方法,为全面指导低压台区运行、维护、抢修、技改、规划等各领域的工作奠定基础。传统的台区用户识别方法分为人工识别和利用专用的台区识别设备两种。人工识别需要依靠电力人员到现场逐户排查台区用户的归属情况,费时费力且效率极低。台区用户识别仪多数基于电力载波技术直接通信与否或电流脉冲技术等来识别台区信息。载波信号通过共地、共高压、并行布线耦合的方式向周边台区传输数据,尽管信号幅值有所衰减,仍能和邻近变压器下距离较近的电表进行通信,故仍然存在“串台区”的问题。基于电力载波与脉冲载波混合方式的配电台区用户辨识虽然解决了共高压串线、共地串线、共电缆沟串线问题,但仍需人工测量,而且采用电流钳进行配电台区用户辨识的过程中可能存在安全隐患,难以满足配电台区的智能化发展需求。
技术实现思路
本专利技术所要解决的技术问题是:针对上述存在的问题,提供了一种基于主成分分析和改进k-means聚类的台区用户识别方法。本专利技术采用的技术方案如下:一种基于主成分分析和改进k-means聚类的台区用户识别方法,包括以下过程:步骤1,获取台区变压器低压侧及用户电表电压数据;步骤2,对电压数据进行主成分分析,获取低维度分析对象;步骤3,确定k-means聚类个数k;步骤4,计算待聚类对象数据密度,确定初始聚类质心;步骤5,采用k-means聚类算法对待聚类对象进行聚类,然后识别台区用户关系进一步的,所述步骤1的具体过程为:获取l台台区变压器低压侧电压数据其中,表示第n个时刻第f台变压器A相的低压侧电压;表示第n个时刻第f台变压器B相的低压侧电压;表示第n个时刻第f台变压器A相的低压侧电压;待识别的m台用户电表电压数据其中,表示第n个时刻第f台待识别用户电表电压。进一步的,所述步骤2的具体过程为:步骤21,将台区变压器低压侧电压数据和待识别电表电压数据组成形成矩阵步骤22,对所有的电压数据进行去中心化所有去中心化的电压数据组成新的样本矩阵X';步骤23,计算样本的协方差矩阵C=X'X'T,对矩阵C进行特征值分解;步骤24,取出最大的n'个特征值对应的特征向量(w1,...wn'),将所有的特征向量标准化后,组成特征向量矩阵W;步骤25,对样本集中的每一个样本X,转化为新的样本Z=WTX,得到降维后的矩阵其中Zf=[zf1,zf2,...,zfn']。进一步的,所述步骤4的具体过程为:步骤41,计算任意两个对象之间的距离Lpq,其中,Lpq为第p个样本到第q个样本的距离;步骤42,计算所有对象间的平均距离MeanL,式中,n'为样本的数据维度;步骤43,计算对象Zp的密度Den(Zp),其中当z≥0时,u(z)=1,否则u(z)=0;选取数据密度最大的对象作为第1个初始聚类中心,选择密度第二大的对象作为第2个初始聚类中心,依此类推,直到达到预定的聚类数k为止。进一步的,所述步骤5的具体过程为:步骤51,基于确定的聚类数k,以及选取的k个初始聚类质心,进行初始化;步骤52,分别计算所有样本到k个初始聚类质心的距离Lpq,按照距离大小将样本分配给最近的中心点;步骤53,按距离对所有样本分完组之后,计算每个组的均值,作为新的质心;步骤54,重复步骤52、步骤53直到新的质心和原质心距离小于阈值,算法结束,将l+m个对象分为k类。进一步的,所述步骤41和步骤51中,所述距离Lpq采用欧式距离来定义,式中,zpd为第p个行向量的第d维坐标,zqd为第q个行向量的第d维坐标。进一步的,所述步骤41和步骤51中,所述距离Lpq采用余弦相似度来定义,其中,zp'为行向量zp的转置。zq'为行向量zq的转置。进一步的,所述步骤41和步骤51中,所述距离Lpq采用相关系数来定义,其中,为单位行向量。进一步的,所述步骤52中,如果样本到多个质心的距离相等,则可划分到任意组中。进一步的,所述步骤53中,通过求样本每个维度的平均值来计算均值。与现有技术相比,采用上述技术方案的有益效果为:1.采用聚类分析的方法进行台区用户识别,规避了传统方法辨识不可靠、效率低且存在安全隐患的问题,并且降低了硬件和人工成本;2.利用主成分分析算法对待聚类的电压数据进行数据预处理,通过降维技术把多维的电压数据化为较少的几个主成分来进行分析,从而降低了算法计算量,提高了算法效率;3.充分利用k-means算法简单、收敛速度快的优势,并综合考虑初始聚类中心的选择及聚类个数的选取两个因素,对常规的k-means算法进行改进,克服了其容易陷入局部最优解的缺陷,能够准确有效地识别用户所属台区与相别,能够彻底解决跨台区用户归属难题,为全面指导低压台区运行、维护、抢修、技改、规划等各领域的工作奠定基础。附图说明图1是典型台区变压气与用户表拓扑架构。图2是本专利技术基于主成分分析和k-means聚类的台区用户识别方法流程示意图。图3是直接采用k-means聚类,不确定初始聚类质心时,数据量和辨识准确度的情况示意图。图4是本专利技术指定初始质心,采用欧式距离来度量两个对象之间的距离时,数据量和辨识准确度的情况示意图。图5是本专利技术指定初始质心,采用余弦相似度来度量两个对象之间的距离时,数据量和辨识准确度的情况示意图。图6是本专利技术指定初始质心,采用相关系数来度量两个对象之间的距离时,数据量和辨识准确度的情况示意图。具体实施方式下面结合附图对本专利技术做进一步描述。配电台区用户以辐射状拓扑方式运行,由于不同时刻系统的负荷情况及运行状态不同,用户处的电压会呈现一定的波动。如图1的典型台区变与用户表拓扑关系,同一相的台区变压器和用户的电表之间具有确定的电气连接,因此用户侧的电压会随着台区变的出口电压的升高而升高,二者具有高度的相关性,变化趋势高度一致。即处于同一台区同一相别的用户,电压波动规律具有很强的相似性,而属不同台区的用户,其电气距离远,电压波动相似性较差。因此,基于配网同一台区同一相别的用户电压波动规律相似性强,而属不同台区的用户电压波动相似性较差的特点,可以基于k-means聚类算法对台区用户及变压器低压侧电压数据进行聚类,从而实现台区用户的准确识别。如图2所示,本实施例的基于主成分分析和k-means聚类的台区用户识别方法,包括:步骤1,获取台区变压器低压侧及用户电表电压数据;步骤2,对电压数据进行主成分分析,获取低维度分析对象;步骤3,确定k-means聚类个数k;步骤4,确定初始聚类质心;步骤5,采用k-means聚类算法对待聚类对象进行聚类,然后识别台区用户关系。通本文档来自技高网...

【技术保护点】
1.一种基于主成分分析和改进k‑means聚类的台区用户识别方法,其特征在于,包括以下过程:步骤1,获取台区变压器低压侧及用户电表电压数据;步骤2,对电压数据进行主成分分析,获取低维度分析对象;步骤3,确定k‑means聚类个数k;步骤4,计算待聚类对象数据密度,确定初始聚类质心;步骤5,采用k‑means聚类算法对待聚类对象进行聚类,然后识别台区用户关系。

【技术特征摘要】
1.一种基于主成分分析和改进k-means聚类的台区用户识别方法,其特征在于,包括以下过程:步骤1,获取台区变压器低压侧及用户电表电压数据;步骤2,对电压数据进行主成分分析,获取低维度分析对象;步骤3,确定k-means聚类个数k;步骤4,计算待聚类对象数据密度,确定初始聚类质心;步骤5,采用k-means聚类算法对待聚类对象进行聚类,然后识别台区用户关系。2.如权利要求1所述的基于主成分分析和改进k-means聚类的台区用户识别方法,其特征在于,所述步骤1的具体过程为:获取l台台区变压器低压侧电压数据其中,表示第n个时刻第f台变压器A相的低压侧电压;表示第n个时刻第f台变压器B相的低压侧电压;表示第n个时刻第f台变压器A相的低压侧电压;待识别的m台用户电表电压数据其中,表示第n个时刻第f台待识别用户电表电压。3.如权利要求2所述的基于主成分分析和改进k-means聚类的台区用户识别方法,其特征在于,所述步骤2的具体过程为:步骤21,将台区变压器低压侧电压数据和待识别电表电压数据组成形成矩阵步骤22,对所有的电压数据进行去中心化所有去中心化的电压数据组成新的样本矩阵X';步骤23,计算样本的协方差矩阵C=X'X'T,对矩阵C进行特征值分解;步骤24,取出最大的n'个特征值对应的特征向量(w1,...wn'),将所有的特征向量标准化后,组成特征向量矩阵W;步骤25,对样本集中的每一个样本X,转化为新的样本Z=WTX,得到降维后的矩阵其中Zf=[zf1,zf2,...,zfn']。4.如权利要求3所述的基于主成分分析和改进k-means聚类的台区用户识别方法,其特征在于,所述步骤4的具体过程为:步骤41,计算任意两个对象之间的距离Lpq,其中,Lpq为第p个样本到第q个样本的距离;步骤42,计算所有对象间的平均距离MeanL,式中,n'为样本的数据维度;步骤4...

【专利技术属性】
技术研发人员:唐明何仲潇汪晓华连利波
申请(专利权)人:清华四川能源互联网研究院
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1