一种办公建筑逐时能耗异常数据在线识别与填补方法技术

技术编号:17780383 阅读:16 留言:0更新日期:2018-04-22 09:14
本发明专利技术公开了一种办公建筑逐时能耗异常数据在线识别与填补方法,该方法包括下述步骤:获取历史能耗数据;清洗历史能耗数据,剔除异常数据;根据逐时能耗数据的室外温度、时刻、以及日期属性,建立用能模式特征集,并计算特征值;逐时采集能耗数据,进行用能模式匹配,并找到对应的特征值;在线识别异常数据;对异常数据进行循环插补,并用公式对插补值修正;将插补完成后的无异常数据存入数据库;定期对用能模式的特征值滚动修正,再进行逐时能耗数据在线插补。本发明专利技术能够解决办公建筑逐时能耗中常见异常数据的识别与插补的问题,提高能耗数据质量,为进一步的数据挖掘提供有效数据,推动建筑节能工作的开展。

【技术实现步骤摘要】
一种办公建筑逐时能耗异常数据在线识别与填补方法
本专利技术涉及能耗数据预处理
,特别涉及一种办公建筑逐时能耗异常数据在线识别与填补方法。
技术介绍
我国自2007年起相继制定和颁布了一系列政策法规和相应的技术导则,开展国家机关办公建筑和大型公共建筑能耗监管体系建设,截止2015年底,北京、上海、天津、深圳等31个省市已建成了联网的国家机关办公建筑和大型公共建筑动态能耗监测平台。办公建筑节能是建设绿色智慧城市的重要内容。办公建筑能耗数据是办公建筑能耗基准评估、用能评价、节能改造的基础,其数据质量严重影响办公建筑节能工作的开展。办公建筑能耗数据在采集、通信、传输、存储等各个环节容易受到噪声干扰、传感器失效、通信中断等多种因素的影响,产生大量缺失、突变或非正常零值等各种异常,导致数据质量不高,直接影响办公建筑节能工作的开展。实时监测数据中的缺失数据大都通过数据插值的方法进行填补从而提高数据质量,降低数据缺失带来的影响。常用的插值方法有拉格朗日插值法、牛顿插值法、三次样条插值法。此外,张熙等人提出了一种周期性插值方法来进行含大段连续缺失数据的插补,效果良好;杨石等人提出了一种基于用能模式的智能数据补充方法,显著提高了连续数据缺失段的数据质量。拉格朗日插值法、牛顿插值法及三次样条法这三种插值方法在含随机单点缺失数据的逐时能耗数据中插值效果较为理想,但在含大段连续缺失的能耗数据中插值效果一般。因为这三种插值方法都是根据已有的真实数据进行公式插值,所以插值效果直接与已有真实数据量相关,当缺失数据连续且缺失数据量较大时,真实数据量相对较少,相关性弱,插值效果一般。而周期法插值是根据周期性数据的隐藏周期属性进行插值,隐藏周期属性主要为序列中具有统计学意义的隐周期,及对应的周期均数和峰值,但由于办公建筑逐时能耗数据隐藏周期数比较稳定,变动幅度较小,所以周期法插值的优势不明显,不能很好的反应实际用能情况。基于用能模式的智能数据填充方法采用办公建筑用能模式的精细分类及统计分析得到能耗数据对应的特征值,并在此基础上进行连续缺失数据的插补,该方法比较符合实际用能特征,但是该方法将用能模式分为144类,未充分考虑办公建筑用能模式特点,而用能模式分类数量对数据插补效果的影响较大,且该方法只适用于历史能耗数据的数据插补,无法实现缺失数据的在线插补。
技术实现思路
本专利技术针对办公建筑的用能特性,提出一种办公建筑逐时能耗异常数据在线识别与填补方法,对办公建筑用能模式进行精细分类,统计分析得到能耗数据对应的特征值,并在此基础上进行连续缺失数据的插补,本专利技术能够实现办公建筑能耗数据中大规模数据异常(异常数据百分比可以达到20%)的识别与实时插补,显著提高能耗数据质量。为实现以上目的,本专利技术采取如下技术方案:本专利技术公开了一种办公建筑逐时能耗异常数据在线识别与填补方法,具体包括下述步骤:S1、历史数据用能模式分类及特征值提取:将历史能耗相关数据全部读入建筑历史逐时能耗数据矩阵,经数据初步清洗后,对清洗后的数据进行用能模式分类,并计算各用能模式数据集的特征值;S2、逐时能耗采集数据的在线识别与填补:读取当前时刻的能耗数据,进行用能模式匹配,对逐时能耗采集数据进行在线识别,并对异常数据进行修正填补;S3、用能模式特征值滚动修正,并把滚动修正后的特征值用于逐时能耗数据在线插补中。作为优选的技术方案,在步骤S1中,所述历史数据用能模式分类及特征值提取包括下述步骤:S1.1、程序初始化,参数初始化,设程序将读取总共为M天/组的历史能耗相关数据,M为历史数据采集总天数,M(j1)=M,M(j1)在步骤S1.3中用于记录含有j1时刻有效历史能耗数据的总天数,即除去j1时刻能耗数据为缺失数据的天数后的总天数,在程序初始化时M(j1)全部赋值为M,Q'(j1)=0,Q'(j1)为初步清洗时各时刻的能耗累计值,j1为历史数据采集时刻,0≤j1≤23;S1.2、依次将M天/组的历史能耗相关数据全部读入建筑历史逐时能耗数据矩阵Q(i1,j1)、室外温度数据矩阵T(i1,j1)、以及当前日期DATA(i1),其中,i1为历史数据采集天数,1≤i1≤M;S1.3、异常数据初步清洗,初步清洗逐时能耗突变数据和缺失数据,并将相应的异常数据剔除,统一作为缺失值处理;所述能耗突变数据为离群点;所述缺失数据属于空值,而不为0;S1.4、用能模式分类;用能模式的分类数量=室外干球温度分类属性数量×时刻分类属性数量×日期分类属性数量;S1.5、根据逐时能耗数据的室外温度、时刻、以及日期属性,对初步清洗后的数据集进行分类,总共分成12个数据集,建立12种用能模式数据集的特征集,并计算不含缺失数据的各用能模式数据集的特征值,包括均值μ2(f)和标准差σ2(f),f=1,2,…,12。作为优选的技术方案,在步骤S1.3中,所述异常数据初步清洗的方法如下:S1.3.1、计算24个时刻历史能耗数据初始均值:(1.3.1.1)j1=0,进入步骤(1.3.1.2);(1.3.1.2)i1=1,进入步骤(1.3.1.3);(1.3.1.3)若Q(i1,j1)矩阵中某天某时刻能耗数值为空值,则判定Q(i1,j1)为异常数据即缺失数据,M(j1)=M(j1)-1,否则,Q'(j1)=Q'(j1)+Q(i1,j1);进入步骤(1.3.1.4);(1.3.1.4)i1=i1+1,若i1≤M,则进入步骤(3),否则,进入步骤(1.3.1.5);(1.3.1.5)计算μ0(j1),j1=j1+1,若j1≤23,则进入步骤(1.3.1.2),否则,进入下一步骤S1.3.2,进行标准差计算;S1.3.2、计算24个时刻历史能耗数据初始标准差:(1.3.2.1)j1=0,进入步骤(1.3.2.2);(1.3.2.2)i1=1,进入步骤(1.3.2.3);(1.3.2.3)若Q(i1,j1)矩阵中某天某时刻能耗数值不为空值,则Q″(j1)=Q″(j1)+[Q(i1,j1)-μ0(j1)]2,进入步骤(1.3.2.4);(1.3.2.4)i1=i1+1,若i1≤M,则进入步骤(1.3.2.3),否则,进入步骤(1.3.2.5);(1.3.2.5)计算σ0(j1),其中,M(j1)在上一步S1.3.1中已经进行计算;j1=j1+1,若j1≤23,则进入步骤(1.3.2.2),否则,进入下一步骤S1.3.3,进行突变数据清洗;S1.3.3、清洗突变数据:(1.3.3.1)j1=0,进入步骤(1.3.3.2);(1.3.3.2)i1=1,进入步骤(1.3.3.3);(1.3.3.3)若|Q(i1,j1)-μ0(j1)|>3σ0(j1),判定Q(i1,j1)为异常数据即突变数据,从数据集中去除该数据;进入步骤(1.3.3.4);(1.3.3.4)i1=i1+1,若i1≤M,则进入步骤(1.3.3.3),否则,进入步骤(1.3.3.5);(1.3.3.5)j1=j1+1,若j1≤23,则进入步骤(1.3.3.2),否则,进入下一步骤S1.4。作为优选的技术方案,在步骤S1.4中,所述用能模式分类的具体方法如下:S1.4.1、室外温度分类,将办公建筑逐时能耗数据根据室外干球温度T的分类属性进行模式划分,分为三类:低温:T(i本文档来自技高网
...
一种办公建筑逐时能耗异常数据在线识别与填补方法

【技术保护点】
一种办公建筑逐时能耗异常数据在线识别与填补方法,其特征在于,具体包括下述步骤:S1、历史数据用能模式分类及特征值提取:将历史能耗相关数据全部读入建筑历史逐时能耗数据矩阵,经数据初步清洗后,对清洗后的数据进行用能模式分类,并计算各用能模式数据集的特征值;S2、逐时能耗采集数据的在线识别与填补:读取当前时刻的能耗数据,进行用能模式匹配,对逐时能耗采集数据进行在线识别,并对异常数据进行修正填补;S3、用能模式特征值滚动修正,并把滚动修正后的特征值用于逐时能耗数据在线插补中。

【技术特征摘要】
1.一种办公建筑逐时能耗异常数据在线识别与填补方法,其特征在于,具体包括下述步骤:S1、历史数据用能模式分类及特征值提取:将历史能耗相关数据全部读入建筑历史逐时能耗数据矩阵,经数据初步清洗后,对清洗后的数据进行用能模式分类,并计算各用能模式数据集的特征值;S2、逐时能耗采集数据的在线识别与填补:读取当前时刻的能耗数据,进行用能模式匹配,对逐时能耗采集数据进行在线识别,并对异常数据进行修正填补;S3、用能模式特征值滚动修正,并把滚动修正后的特征值用于逐时能耗数据在线插补中。2.根据权利要求1所述的办公建筑逐时能耗异常数据在线识别与填补方法,其特征在于,在步骤S1中,所述历史数据用能模式分类及特征值提取包括下述步骤:S1.1、程序初始化,参数初始化,设程序将读取总共为M天/组的历史能耗相关数据,M为历史数据采集总天数,M(j1)=M,M(j1)在步骤S1.3中用于记录含有j1时刻有效历史能耗数据的总天数,即除去j1时刻能耗数据为缺失数据的天数后的总天数,在程序初始化时M(j1)全部赋值为M,Q'(j1)=0,Q'(j1)为初步清洗时各时刻的能耗累计值,j1为历史数据采集时刻,0≤j1≤23;S1.2、依次将M天/组的历史能耗相关数据全部读入建筑历史逐时能耗数据矩阵Q(i1,j1)、室外温度数据矩阵T(i1,j1)、以及当前日期DATA(i1),其中,i1为历史数据采集天数,1≤i1≤M;S1.3、异常数据初步清洗,初步清洗逐时能耗突变数据和缺失数据,并将相应的异常数据剔除,统一作为缺失值处理;所述能耗突变数据为离群点;所述缺失数据属于空值,而不为0;S1.4、用能模式分类;用能模式的分类数量=室外干球温度分类属性数量×时刻分类属性数量×日期分类属性数量;S1.5、根据逐时能耗数据的室外温度、时刻、以及日期属性,对初步清洗后的数据集进行分类,总共分成12个数据集,建立12种用能模式数据集的特征集,并计算不含缺失数据的各用能模式数据集的特征值,包括均值μ2(f)和标准差σ2(f),f=1,2,…,12。3.根据权利要求2所述的办公建筑逐时能耗异常数据在线识别与填补方法,其特征在于,在步骤S1.3中,所述异常数据初步清洗的方法如下:S1.3.1、计算24个时刻历史能耗数据初始均值:(1.3.1.1)j1=0,进入步骤(1.3.1.2);(1.3.1.2)i1=1,进入步骤(1.3.1.3);(1.3.1.3)若Q(i1,j1)矩阵中某天某时刻能耗数值为空值,则判定Q(i1,j1)为异常数据即缺失数据,M(j1)=M(j1)-1,否则,Q'(j1)=Q'(j1)+Q(i1,j1);进入步骤(1.3.1.4);(1.3.1.4)i1=i1+1,若i1≤M,则进入步骤(3),否则,进入步骤(1.3.1.5);(1.3.1.5)计算μ0(j1),j1=j1+1,若j1≤23,则进入步骤(1.3.1.2),否则,进入下一步骤S1.3.2,进行标准差计算;S1.3.2、计算24个时刻历史能耗数据初始标准差:(1.3.2.1)j1=0,进入步骤(1.3.2.2);(1.3.2.2)i1=1,进入步骤(1.3.2.3);(1.3.2.3)若Q(i1,j1)矩阵中某天某时刻能耗数值不为空值,则Q″(j1)=Q″(j1)+[Q(i1,j1)-μ0(j1)]2,进入步骤(1.3.2.4);(1.3.2.4)i1=i1+1,若i1≤M,则进入步骤(1.3.2.3),否则,进入步骤(1.3.2.5);(1.3.2.5)计算σ0(j1),其中,M(j1)在上一步S1.3.1中已经进行计算;j1=j1+1,若j1≤23,则进入步骤(1.3.2.2),否则,进入下一步骤S1.3.3,进行突变数据清洗;S1.3.3、清洗突变数据:(1.3.3.1)j1=0,进入步骤(1.3.3.2);(1.3.3.2)i1=1,进入步骤(1.3.3.3);(1.3.3.3)若|Q(i1,j1)-μ0(j1)|>3σ0(j1),判定Q(i1,j1)为异常数据即突变数据,从数据集中去除该数据;进入步骤(1.3.3.4);(1.3.3.4)i1=i1+1,若i1≤M,则进入步骤(1.3.3.3),否则,进入步骤(1.3.3.5);(1.3.3.5)j1=j1+1,若j1≤23,则进入步骤(1.3.3.2),否则,进入下一步骤S1.4。4.根据权利要求2所述的办公建筑逐时能耗异常数据在线识别与填补方法,其特征在于,在步骤S1.4中,所述用能模式分类的具体方法如下:S1.4.1、室外温度分类,将办公建筑逐时能耗数据根据室外干球温度T的分类属性进行模式划分,分为三类:低温:T(i1,j1)<T1;中温:T1<T(i1,j1)<T2;高温:T(i1,j1)>T2;T1,T2通过k均值聚类的方法得出,具体数值为所分出类别的聚类中心;S1.4.2、工作日和休息日分类,办公建筑能耗数据受工作日和休息日影响较大,按日期分类属性将办公建筑能耗数据分为休息日和工作日两类;S1.4.3、上班时刻和下班时刻分类,办公建筑能耗较为规律,根据时刻分类属性将办公建筑能耗数据分为上班时刻和下班时刻两类。5.根据权利要求1所述的办公建筑逐时能耗异常数据在线识别与填补方法,其特征在于,在步骤S2中,所述逐时能耗采集数据的在线识别与填补的具体方法为:S2.1、参数设置初值:i2=1,i3=0,j2=Time,D2(1)=DATE,i2为数据在线采集的日期序号,i3用于记录连续异常数据的个数,j2为数据当前采集时刻,0≤j2≤23,Time为当前时刻,D2(i2)用于记录采集数据的日期,DATE为当前日期,已知电表初始读数Electricity0;S2.2、逐时数据采集:读取当前日期DATE,采集当前时刻电表读数Electricity(i2,j2)和当前室外干球温度Tem2(i...

【专利技术属性】
技术研发人员:周璇崔少伟周裕东梁列全
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1