当前位置: 首页 > 专利查询>吉林大学专利>正文

一种基于深度学习的不平衡数据能耗分解方法技术

技术编号:37382298 阅读:17 留言:0更新日期:2023-04-27 07:23
本发明专利技术公开了一种基于深度学习的不平衡数据能耗分解方法,所述方法首先将数据集进行处理,然后通过一维卷积层进行特征提取,最后通过lstm层进行负荷分解。本发明专利技术针对目前不平衡数据集负荷分解准确率较低的现状,提供了一种基于深度学习的不平衡数据的能耗分解方法,该方法通过将不平衡数据集转换为平衡数据集,进而对其进行负荷分解,极大提高了不平衡数据集负荷分解的准确度。集负荷分解的准确度。集负荷分解的准确度。

【技术实现步骤摘要】
一种基于深度学习的不平衡数据能耗分解方法


[0001]本专利技术属于非侵入式负荷监测领域,涉及一种不平衡数据能耗分解方法,具体涉及一种基于深度学习的不平衡数据能耗分解方法。

技术介绍

[0002]非侵入式负荷监测(non

intrusive load monitoring,NILM)由Hart于20世纪80年代提出,其实质就是负荷分解,即将用户总负荷信息分解为各用电设备的信息,进而获取用电设备能耗情况与用户用电规律等用电信息。这些用电信息具有很高的应用价值,可为电网公司、用户等多方带来效益。与侵入式负荷监测相比,NILM的经济投入小,实用性强。因此,NILM自提出以来,就引起广泛关注。近年来随着智能家居、智能电网的蓬勃发展,NILM研究热潮在国内外再次兴起,然而国内关于非侵入式负荷监测与分解的研究尚不充分,有较大的提升空间。2011年,Kolter等人构建了第一个公开可用的REDD数据集,其对非侵入式负荷监测技术的研究有着极大的促进作用。2012年,Anderson等人提出了用于负荷分解的BLUED数据集,其中包含了来自单个家庭的数据。
[0003]随着大数据、互联网时代信息数据的广泛应用,数据信息在生活和生产应用中的地位越发重要。然而,在多数情况下,因为一些不可避免的原因,收集的数据分布是不平衡的,这样的数据集被称为非平衡数据集或者不平衡数据集。数量较少的那一类样本被称作少数类或者正样本,数量较多的那一类样本则被称为多数类或者负样本。对于大多数学习算法而言,非平衡数据是一个难题。因为这些算法假设样本类别分布均匀,并且倾向于学习和认可多数类,导致类别属于少数类的样本往往被错误分类。因此,非平衡数据分类问题常以少数类数据作为重点关注的对象。如何挖掘少数类数据的关键信息是非平衡数据分类关注的重点之一。传统的机器学习考虑的是算法整体性能,趋向于使学习模型的整体的准确率最高。尤其是,当少数类样本个数非常稀少,且使用准确率作为模型好坏的评价指标时,数量占比较低的少数类数据即使被错分,也不会对整体的准确率有什么太大的影响。然而,在非平衡数据集中少数类样本被错分的代价往往非常大。因此,传统的机器学习方法在对非平衡数据分类时极易造成偏差,多数传统方法不适用于非平衡数据集的分类。

技术实现思路

[0004]为了解决不平衡数据集中由于各类负荷出场率不同,所以在进行非侵入式负荷分解时表现较差,即分解值与真实值往往相差较大的问题,本专利技术提供了一种基于深度学习的不平衡数据能耗分解方法。
[0005]本专利技术的目的是通过以下技术方案实现的:
[0006]一种基于深度学习的不平衡数据能耗分解方法,包括如下步骤:
[0007]步骤一:采用邻域清理规则(NCL)将不平衡数据集变为相对平衡的数据集;
[0008]步骤二:特征提取
[0009]步骤二一、使用过滤式特征选择进行特征评估;
[0010]步骤二二、使用一维卷积神经网络对功率序列进行卷积,依靠卷积中的卷积核进行功率特征的提取;
[0011]步骤三:基于LSTM的负荷分解
[0012]将步骤二提取的功率特征输入到LSTM模型中,计算以下变量:
[0013]f
t
=σ(W
f
*[h
t
‑1,x
t
]+b
f
)
[0014]i
t
=σ(W
i
*[h
t
‑1,x
t
]+b
i
)
[0015][0016][0017]o
t
=σ(W
o
*[h
t
‑1,x
t
]+b
o
)
[0018]h
t
=σ*tanh(C
t
)
[0019]式中,C
t
‑1和C
t
分别代表上一时刻的细胞状态跟这一时刻的细胞状态,h
t
‑1和h
t
分别代表上一时刻的隐藏状态跟这一时刻的隐藏状态,f
t
、i
t
、o
t
分别代表遗忘门、输入门和输出门,W
i
、W
f
、W
c
、W
o
分别代表权重矩阵,b
f
、b
i
、b
c
、b
o
分别代表偏置项,tanh和σ分别代表激活函数,[h
t
‑1,x
t
]代表一个拼接矩阵。
[0020]相比于现有技术,本专利技术具有如下优点:
[0021]本专利技术针对目前不平衡数据集负荷分解准确率较低的现状,提供了一种基于深度学习的不平衡数据的能耗分解方法,该方法通过将不平衡数据集转换为平衡数据集,进而对其进行负荷分解,极大提高了不平衡数据集负荷分解的准确度。
附图说明
[0022]图1为本专利技术基于深度学习的不平衡数据能耗分解方法的流程图;
[0023]图2为邻域清理流程图;
[0024]图3为特征选择流程图;
[0025]图4为基于LSTM的负荷能耗分解图;
[0026]图5为在微波炉上采用本专利技术模型做出来的分解图;
[0027]图6为在微波炉上采用DAE模型做出来的仿真图。
具体实施方式
[0028]下面结合附图对本专利技术的技术方案作进一步的说明,但并不局限于此,凡是对本专利技术技术方案进行修改或者等同替换,而不脱离本专利技术技术方案的精神和范围,均应涵盖在本专利技术的保护范围中。
[0029]本专利技术提供了一种基于深度学习的不平衡数据能耗分解方法,首先将数据集进行处理,然后通过一维卷积层进行特征提取,最后通过lstm层进行负荷分解。如图1所示,所述方法包括如下步骤:
[0030]步骤一:采用邻域清理规则(NCL)将不平衡数据集变为相对平衡的数据集。
[0031]邻域清理规则(NCL)的主要思想:如图2所示,针对训练样本集中的每个样本找出其三个最近邻样本,若该样本是多数类样本且其三个最近邻中有两个以上是少数类样本,则删除它;反之当该样本是少数类并且其三个最近邻中有两个以上是多数类样本,则去除
近邻中的多数类样本。
[0032]步骤二:特征提取
[0033]步骤二一、使用过滤式特征选择进行特征评估。
[0034]过滤式特征选择是通过子集本身数据内在特点进行特征评估,与具体分类算法无关,具有较好的通用性,并且算法复杂度较低,缺点是分类准确率低于wrapper方法。
[0035]步骤二二、使用一维卷积神经网络对功率序列进行卷积,核心为依靠卷积中的卷积核进行功率特征的提取。
[0036]一维卷积神经网络的公式为:V=g(W*U+b),其中:g代表的是激活函数,引入激活函数可以增强模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的不平衡数据能耗分解方法,其特征在于所述方法包括如下步骤:步骤一:采用邻域清理规则将不平衡数据集变为相对平衡的数据集;步骤二:特征提取步骤二一、使用过滤式特征选择进行特征评估;步骤二二、使用一维卷积神经网络对功率序列进行卷积,依靠卷积中的卷积核进行功率特征的提取;步骤三:基于LSTM的负荷分解将步骤二提取的功率特征输入到LSTM模型中,计算以下变量:f
t
=σ(W
f
*[h
t
‑1,x
t
]+b
f
)i
t
=σ(W
i
*[h
t
‑1,x
t
]+b
i
))o
t
=σ(W
o
*[h
t
‑1,x
t
]+b
o
)h
t
=σ*tanh(C
t
)式中,C
t
‑1和C
t
分别代表上一时刻的细胞状态跟这一时刻的细胞状态,h
t
‑1和h
t
分别代表上一时刻的隐藏状态跟这一时刻的隐藏状态,f
t
、i

【专利技术属性】
技术研发人员:周求湛李媛媛王聪荣静冀泽宇刘志宏
申请(专利权)人:吉林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1