当前位置: 首页 > 专利查询>河海大学专利>正文

基于节点日负荷曲线的深度嵌入式负荷聚类方法及装置制造方法及图纸

技术编号:36213389 阅读:21 留言:0更新日期:2023-01-04 12:10
本发明专利技术采用了一种基于日负荷曲线的深度嵌入式负荷聚类方法,包括:获取日负荷数据并进行预处理,得到日负荷曲线;采用自动编码器的编码器部分对日负荷曲线进行升维和特征提取得到潜在聚类特征,并将潜在聚类特征送入K

【技术实现步骤摘要】
基于节点日负荷曲线的深度嵌入式负荷聚类方法及装置


[0001]本专利技术属于电力系统分析领域,具体涉及一种基于日负荷曲线的深度嵌入式负荷聚类方法及装置。

技术介绍

[0002]负荷建模是电力系统建模不可或缺一部分,负荷数据中含有丰富信息,能体现客户用电模式,了解用电特点,提升预测用电量精确度,指导电价制定等。所以研究更加有效的电力负荷处理技术是非常有必要的,基于日负荷曲线的负荷节点分类是其重要组成部分。
[0003]传统的负荷节点分类方法为统计综合法,该方法需要耗费大量的财力物力,且十分耗时。目前多采用基于人工智能方法的日负荷曲线聚类方法,这大大提高了工作效率。电力负荷曲线聚类实质上是利用无监督的算法,将没有标签的负荷数据根据曲线的相似性将其划分到不同的类簇中以提取它的群体特性。当前研究大多采用降维算法和聚类算法结合的思路,这些降维算法都能有效降低数据的时空复杂度,但对曲线的时序特征不能做很好的保留。

技术实现思路

[0004]综合考虑以上情况,本专利技术提出采用改进的深度嵌入式聚类算法(Improved Deep Embedded Clustering,IDEC)对日负荷曲线进行聚类研究,该方法先使用自动编码器的编码器部分对日负荷曲线进行升维和特征提取,送入K

Means层得到初始聚类中心;然后联合优化重构损失和聚类损失,得到聚类结果。
[0005]考虑到目前用于聚类的负荷数据大多不超过288维(每5min一个采集点),现代计算机的计算能力很强,本专利技术提出采用升维

聚类的改进方法并在IDEC算法中进行了实践。先将日负荷数据映射到一个更高的维度上,再进行特征提取和聚类。对曲线的时序特征能做很好的保留,特征提取与聚类任务不处于分离状态,保持聚类的质量。
[0006]为达到上述目的,本专利技术是采用下述技术方案实现的:
[0007]第一方面,提供一种基于日负荷曲线的深度嵌入式负荷聚类方法,包括:
[0008]获取日负荷数据并进行预处理,得到日负荷曲线;
[0009]采用自动编码器的编码器部分对日负荷曲线进行升维和特征提取得到潜在聚类特征,并将潜在聚类特征送入K

Means聚类层得到初始聚类中心;
[0010]利用预构建的损失函数对初始聚类中心迭代更新优化直至满足迭代停止条件,得到聚类结果;其中所述损失函数由重构损失和聚类损失联合构成。
[0011]在一些实施例中,所述损失函数L为:L=L
r
+γL
c

[0012]其中L
r
是重构损失,L
c
是聚类损失,γ>0是一个控制嵌入空间扭曲程度的系数;
[0013]重构损失L
r
采用均方误差MSE;
[0014]聚类损失L
c
采用KL散度。
[0015]在一些实施例中,利用预构建的损失函数对初始聚类结果迭代更新优化,包括:
[0016]有n个样本组成的数据集X,每一个样本d为数据的维度;聚类数K是先验知识,第j个聚类中心用来表示;s
i
∈{1,2,...,K}表示分配给聚类样本x
i
的聚类指标;
[0017]自动编码器由两个部分组成,分别是编码器z=f
W(x)
和解码器x'=g
W'(z)
,解码器用于数据的重构;f
W
是编码器的映射,即z
i
=f
W
(x
i
),其中x
i
是数据集X中的一个样本,嵌入点z
i
通过f
W
提取;
[0018]定义非线性映射f
W
:x
i

z
i
和g
W'
:z
i

x'
i
,z
i
是x
i
在高维空间上的嵌入点,x'
i
是x
i
经过自动编码器重构后的样本,即编码过程是升维过程而重构过程是降维过程;
[0019]所述损失函数L为:L=L
r
+γL
c

[0020]其中γ>0是一个控制嵌入空间扭曲程度的系数;
[0021]重构损失L
r
采用均方误差MSE:其中g
W'
(x
i
)表示经过自动编码器的编码器重构后的样本;
[0022]聚类损失L
c
采用KL散度;
[0023]其中q
ij
是嵌入点z
i
和聚类中心μ
j
之间的相似性,由students

t分布测定:
[0024][0025]目标分布p
ij
定义为:
[0026][0027]采用小批量随机梯度下降SGD和反向传播进行优化,有三种参数需要优化或更新:自动编码器的权重,聚类中心和目标分布;
[0028]更新自动编码器的权重和聚类中心:固定目标分布P,聚类损失L
c
相对于嵌入点z
i
的梯度为:聚类损失L
c
相对于聚类中心μ
j
的梯度为:
[0029]给定一个小批量样本,样本数为m,学习率为λ,聚类中心μ
j
更新公式为
编码器的权重W'和解码器的权重W更新公式为,
[0030]为了避免过拟合现象的发生,对损失函数L进行正则化处理;
[0031]更新目标分布P:每T次迭代使用所有嵌入点更新目标分布;更新目标分布时,分配给x
i
的标签为:
[0032]在一些实施例中,对损失函数L进行正则化处理,包括:在损失函数L后面加上一个L1正则化项,即全部权重的绝对值之和,再乘以λ/n,其中λ为正则化参数。
[0033]在一些实施例中,迭代停止条件为:前两次的标签分布结果差异小于预设阈值。
[0034]在一些实施例中,所述预处理包括:
[0035]进行缺失数据和异常数据的剔除,数据归一化处理;
[0036]其中进行缺失数据和异常数据的剔除包括:
[0037]对缺失和异常数据进行检测:对缺失数据的判断依据为数据记录中出现连续的15个负荷值为0或者缺失数据,数据记录中出现的30个负荷值为0或者缺失数据以及负荷记录中所有负荷值都一样的数据;对突然升高或降低的数据即与前一数据点相比,升高或降低超过25%的数据,则认定为异常数据;
[0038]对缺失数据和异常数据进行剔除。
[0039]在一些实施例中,在得到聚类结果后,还包括对每一类的结果求均值得到各类曲线的聚类中心,计算聚类效果评价指标值,所述聚类本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于日负荷曲线的深度嵌入式负荷聚类方法,其特征在于,包括:获取日负荷数据并进行预处理,得到日负荷曲线;采用自动编码器的编码器部分对日负荷曲线进行升维和特征提取得到潜在聚类特征,并将潜在聚类特征送入K

Means聚类层得到初始聚类中心;利用预构建的损失函数对初始聚类中心迭代更新优化直至满足迭代停止条件,得到聚类结果;其中所述损失函数由重构损失和聚类损失联合构成。2.根据权利要求1所述的基于日负荷曲线的深度嵌入式负荷聚类方法,其特征在于,所述损失函数L为:L=L
r
+γL
c
,其中L
r
是重构损失,L
c
是聚类损失,γ>0是一个控制嵌入空间扭曲程度的系数;重构损失L
r
采用均方误差MSE;聚类损失L
c
采用KL散度。3.根据权利要求1所述的基于日负荷曲线的深度嵌入式负荷聚类方法,其特征在于,利用预构建的损失函数对初始聚类结果迭代更新优化,包括:有n个样本组成的数据集X,每一个样本d为数据的维度;聚类数K是先验知识,第j个聚类中心用来表示;s
i
∈{1,2,...,K}表示分配给聚类样本x
i
的聚类指标;自动编码器由两个部分组成,分别是编码器z=f
W(x)
和解码器x'=g
W'(z)
,解码器用于数据的重构;f
W
是编码器的映射,即z
i
=f
W
(x
i
),其中x
i
是数据集X中的一个样本,嵌入点z
i
通过f
W
提取;定义非线性映射f
W
:x
i

z
i
和g
W'
:z
i

x

i
,z
i
是x
i
在高维空间上的嵌入点,x

i
是x
i
经过自动编码器重构后的样本,即编码过程是升维过程而重构过程是降维过程;所述损失函数L为:L=L
r
+γL
c
,其中γ>0是一个控制嵌入空间扭曲程度的系数;重构损失L
r
采用均方误差MSE:其中g
W'
...

【专利技术属性】
技术研发人员:李程昊刘明洋高泽王骅方舟陈嘉雯陈幸伟陈谦高昆曹晓璐
申请(专利权)人:河海大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1