【技术实现步骤摘要】
一种基于共享近邻与吸引度的密度峰值聚类的用户用电行为分析方法
[0001]本专利技术属于电力数据检测领域,具体涉及一种基于共享近邻与吸引度的密度峰值聚类的用户用电行为分析方法。
技术介绍
[0002]近年来,随着智能电网的建设与发展,电力系统各环节安装和部署了众多的数据采集传感器,获取了大量的电力数据。这些数据随着采集和监控范围的不断扩大、监测指标的不断增加而呈指数量级的增长态势,是电力大数据的主要来源。如何挖掘电力大数据中的有效信息和隐含规律,并将其运用到实践指导中,对智能电网的管理运营和电力用户的可持续发展均具有深远意义。
[0003]目前,电力大数据在电力负荷预测、电力异常值检测和用电行为分析等方面有着广泛应用。电力负荷预测是指根据系统运行特性、负荷的历史数据及其他影响因子,在一定预测精度的要求下,以未来气象、经济等因素的发展趋势为依据,估计和推测未来某一时刻的电力负荷。电力异常值检测是根据用户历史用电数据挖掘出的用电规律,通过数据相似性比较,寻找出异常的用电行为。作为电力负荷预测和电力异常值检测的基础,用电行为分析是对用户用电负荷曲线所反映的信息进行分析,挖掘出用户用电行为特征,为智能电网的规划运行、电力设备的检修以及用户服务的优化等提供多方面支持。本文以用户的日负荷数据作为其用电行为特征的研究和分析对象。
[0004]用户用电行为分析的相关研究中,很多学者通过聚类算法对用户的用电特征进行提取。用电行为分析中常用的聚类算法主要包括K
‑
means等基于划分的聚类、 Chame ...
【技术保护点】
【技术特征摘要】
1.一种基于共享近邻与吸引度的密度峰值聚类的用户用电行为分析方法,其特征是,步骤如下:步骤1:对用户的用电负荷数据进行预处理,对缺失数据进行插补,剔除无效数据;步骤2:采用PCA技术对负荷数据进行降维,计算特征矩阵,提取其主成分;步骤3:以降维后的数据作为输入,利用DPC
‑
SNA算法的共享近邻的局部密度和吸引度的分配策略进行聚类;步骤4:对聚类结果进行分析,重构用户的用电负荷曲线,并进行用户用电行为分析。2.根据权利要求1所述的一种基于共享近邻与吸引度的密度峰值聚类的用户用电行为分析方法,其特征是:步骤3中DPC
‑
SNA算法的流程如下:(1)输入降维后的数据集data,样本近邻个数K;(2)将数据归一化处理;(3)计算样本间的欧氏距离d
ij
;(4)以共享近邻的局部密度的方式,将样本X
i
的共享近邻相似度S(i,j)累加,得到样本X
i
的局部密度ρ
i
值,依据局部密度ρ
i
,取局部密度大于样本i的ρ
i
且距其最近点的距离,作为样本X
i
的相对距离δ
i
;再将全体样本的密度降序排列后,把密度最高样本的相对距离设定为最大值,即样本的δ
i
值;(5)计算出所有样本的ρ
i
和δ
i
值后,以ρ
i
作为横坐标,δ
i
作为纵坐标,建立决策图,选取ρ
i
和δ
i
都较大的点作为密度峰值即类簇中心或者通过γ
i
选取密度峰值;(6)将样本视作质点,数据集内的样本间均具有吸引力将样本间的共享近邻相似度引入样本的吸引度计算,得到样本的吸引度矩阵;(7)在吸引度矩阵中找到与已分配样本吸引度最大的核心样本,将其分配给已分配样本所在类簇;(8)当所有已分配样本与未分配样本吸引度达到零时,转至步骤(9),否则,转至步骤(7)再次寻找...
【专利技术属性】
技术研发人员:李卿鹏,杨琴,李勇平,陈真,王煜晗,刘宝宏,王刚,傅丽丽,
申请(专利权)人:国家电网有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。