基于改进DAGMM的建筑用电负荷曲线异常检测方法技术

技术编号:36259752 阅读:49 留言:0更新日期:2023-01-07 09:57
本发明专利技术公开了基于改进DAGMM的建筑用电负荷曲线异常检测方法,包括步骤:生成数据特征;统计数据分布,将数据异常点进行截短处理;数据归一化;将数据集分为训练集和测试集;采用DAGMM网络模型中的压缩网络和评估网络构建模型,压缩网络将高维度特征压缩到低维度,评估网络用于预测GMM的概率,学习到每个向量属于某个高斯分布的概率;模型训练和模型预测等。本发明专利技术基于DAGMM模型改进应用,对建筑用电负荷曲线的各个时点差异进行加权计算,并在惩罚项计算时将协方差矩阵加上一个对角矩阵,能识别出异常和单个或多个时点的功耗异常,增加了点异常的检测步骤,排除该类异常点对模型检测效果的影响。效果的影响。效果的影响。

【技术实现步骤摘要】
基于改进DAGMM的建筑用电负荷曲线异常检测方法


[0001]本专利技术属于建筑用电负荷
,尤其涉及基于改进DAGMM的建筑用电负荷曲线异常检测方法。

技术介绍

[0002]都市中的高楼大厦,在给人们生活带来便利的同时,也是城市中的“碳排放大户”。到2030年建筑用电占建筑能耗比例或许将超过65%,完善用电技术体系、提高用电智能化和用电精细化管理也就成为了一项需要持续推进的目标。建筑用电日负荷曲线是描述日内负荷随时间变化的曲线,对建筑用电日负荷曲线进行异常检测,可以检测偏离数据主要分布的点异常、群组异常或上下文异常,进而识别出异常用电行为、用电突出隐患、设备故障、抄表系统异常等问题,帮助用电单位完成及时整改并跟踪督促和落实效果,从而降低用电单位的成本。
[0003]异常检测的算法按照模型类别包括监督学习类型DNN,半监督学习类型OneClass

SVM、无监督学习类型AutoEncoder和混合型等。DAGMM异常检测算法采用AutoEncoder的方法进行降维,然后使用降维后的特征进行GMM密度估计,发现异常。由于DAGMM算法采用端到端的方式进行训练,在降维过程中会考虑异常检测的结果,因此不会丢失异常检测所需的关键信息,解决了传统算法采用分步训练带来的缺点。DAGMM算法是一个通用的时间序列异常检测算法,针对特定的业务场景可以作进一步的改进,以获得更好的异常检测效果。

技术实现思路

[0004]建筑用电日负荷曲线以每日负荷24个时点的数据为整体考虑对象,在计算Encoder网络和Dencoder网络的拟合误差时,不仅仅要考虑DAGMM算法中采用的24个时点数据的累计拟合误差,还需要考虑某个或某些时点绝对拟合误差,这样才能发现极多数样本拟合误差很少而极少数时点存在较大误差的情形,因此本专利技术对DAGMM算法进行改进,并应用在建筑能耗日负荷曲线的异常检测中。有鉴于此,本专利技术提出了一种基于改进DAGMM的建筑用电日负荷曲线异常检测方法IDAGMM。建筑用电日负荷曲线的数据每天是24个数据,虽然异常检测时负荷曲线的形状特征和累计误差需要考虑,但是在每个时点上的绝对差值是需要更加关注的因素,因为这可能意味着该时点存在明显的异常。IDAGMM对DAGMM算法的损失函数进行了改进,突出了各个时点数据的绝对差值的权重,使得异常识别检测算法不仅能识别出形态不同的负荷曲线异常,也能识别出单个或多个时点的功耗异常。另外,本专利技术的IDAGMM增加了点异常的检测步骤,统计分析各个时点的能耗数据,将超出范围的异常点数据作截断处理,以排除这些异常点的数据对异常模式的检测效果的影响。IDAGMM算法的提出为建筑用电日负荷曲线异常检测提供了一种有效的分析手段,从而为智能化用电和精细化管理提供了有力的支撑。
[0005]本专利技术公开的基于改进DAGMM的建筑用电负荷曲线异常检测方法,包括以下步骤:
[0006]收集整理小时级别的建筑用电数据,生成数据特征;
[0007]统计分析各个时点数据的分布,将数据异常点进行截短处理;
[0008]数据归一化;
[0009]数据集准备和模型构建:按照时间顺序将数据集分为训练集和测试集,其中训练集占比为80%,测试集占比为20%,并采用DAGMM网络模型中的压缩网络和评估网络构建模型;压缩网络包括编码器和解码器两部分,将高维度特征压缩到低维度,编码器作用是降维,解码器的作用是将降维特征还原成原始输入;输入向量x经过编码器降维为特征z
c
,继续经过解码器生成向量x

,然后计算x和x

的差异得到重构误差特征z
r
;评估网络用于预测GMM的概率,学习到每个向量属于哪个高斯分布的概率;重构误差特征和降维特征合并成特征z作为评估网络的输入,输出是高斯分布的概率;其中在重构误差过程中对各个单点差异进行加权计算,并在惩罚项计算时将协方差矩阵加上一个对角矩阵,帮助协方差矩阵消除奇异性。
[0010]进一步的,所述截短处理包括对每个时点数据依次如下处理:
[0011]计算数据第一个四分位数Q1、第三个四分位数Q3;
[0012]计算四分位数范围IQR=Q3

Q1;
[0013]计算上限:Q3+1.5*IQR,下限:Q1

1.5*IQR;
[0014]任何大于上限的数据以上限替代,任何小于下限的数据以下限替代。
[0015]进一步的,所述重构误差计算包括:
[0016][0017]其中,Z
r
为重构误差,x
i
为第i个输入向量,x
i

为解码器的第i个输出向量,k为加权系数,n为向量长度。
[0018]进一步的,所述协方差矩阵加上一个对角矩阵后如下:
[0019][0020]进一步的,模型训练的目标函数包括三个部分:第一项为DeepAutoEncoder的重构误差;第二项为评估网络的拟合误差;第三项为防止GMM模型中协方差对角线为0的惩罚项:
[0021][0022]其中,E(z
i
)为能量函数,计算样本的能量值,该值越大,样本异常可能性越大;λ1和λ2为超参数,N为样例数目。
[0023]进一步的,对训练集能量函数计算的能量值进行统计,计算得到能量值的门限值;对测试集的数据进行预测计算获得每个样本的能量值,如果能量值超过门限,判定该样本为异常样本:
[0024]E=sorted(E(z
i
))i=1,2,...,N
[0025]threshold=E
j
,j=N*precent
[0026]I
predict
=exception if E
predict
>threshold else normal
[0027]其中,E为排序后的能量值集合,threshold为门限值,N为样例数目,percent为正常值所占比例,I
predict
为预测样本,E
predict
为预测样本的能量值。
[0028]本专利技术的有益效果如下:
[0029]本专利技术对DAGMM算法的损失函数进行改进,突出各个时点数据的绝对差值的权重,使得异常识别检测算法不仅能识别出形态不同的负荷曲线异常,也能识别出单个或多个时点的功耗异常。
[0030]本专利技术的IDAGMM增加了点异常的检测步骤,统计分析各个时点的能耗数据,将超出范围的异常点数据作截断处理,以排除这些异常点的数据对异常模式的检测效果的影响。本专利技术为建筑用电日负荷曲线异常检测提供了一种有效的分析手段,从而为智能化用电和精细化管理提供了有力的支撑。
附图说明
[0031]图1本专利技术框架总体示意图;
[0032]图2本专利技术的网络模型结构图;
[0033]图3某建筑电力日负荷曲线异常本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于改进DAGMM的建筑用电负荷曲线异常检测方法,其特征在于,包括以下步骤:收集整理小时级别的建筑用电数据,生成数据特征;统计分析各个时点数据的分布,将数据异常点进行截短处理;数据归一化;数据集准备和模型构建:按照时间顺序将数据集分为训练集和测试集,其中训练集占比为80%,测试集占比为20%,并采用DAGMM网络模型中的压缩网络和评估网络构建模型;压缩网络包括编码器和解码器两部分,将高维度特征压缩到低维度,编码器作用是降维,解码器的作用是将降维特征还原成原始输入;输入向量x经过编码器降维为特征z
c
,继续经过解码器生成向量x

,然后计算x和x

的差异得到重构误差特征z
r
;评估网络用于预测GMM的概率,学习到每个向量属于某个高斯分布的概率;重构误差特征和降维特征合并成特征z作为评估网络的输入,输出是高斯分布的概率;其中在重构误差过程中对各个单点差异进行加权计算,并在惩罚项计算时将协方差矩阵加上一个对角矩阵,帮助协方差矩阵消除奇异性。2.根据权利要求1所述的基于改进DAGMM的建筑用电负荷曲线异常检测方法,其特征在于,所述截短处理包括对每个时点数据依次如下处理:计算数据第一个四分位数Q1、第三个四分位数Q3;计算四分位数范围IQR=Q3

Q1;计算上限:Q3+1.5*IQR,下限:Q1

1.5*IQR;任何大于上限的数据以上限替代,任何小于下限的数据以下限替代。3.根据权利要求1所述的基于改进DAGMM的建筑用电负荷曲线异常检测方法,其特征在于,所述重构误差计算包括:其中,Z
r

【专利技术属性】
技术研发人员:夏麟尹志武
申请(专利权)人:华建数创上海科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1