一种办公建筑逐时能耗异常数据在线识别与填补方法技术

技术编号：17780383 阅读：16 留言：0更新日期：2018-04-22 09:14

本发明专利技术公开了一种办公建筑逐时能耗异常数据在线识别与填补方法，该方法包括下述步骤：获取历史能耗数据；清洗历史能耗数据，剔除异常数据；根据逐时能耗数据的室外温度、时刻、以及日期属性，建立用能模式特征集，并计算特征值；逐时采集能耗数据,进行用能模式匹配，并找到对应的特征值；在线识别异常数据；对异常数据进行循环插补，并用公式对插补值修正；将插补完成后的无异常数据存入数据库；定期对用能模式的特征值滚动修正，再进行逐时能耗数据在线插补。本发明专利技术能够解决办公建筑逐时能耗中常见异常数据的识别与插补的问题，提高能耗数据质量，为进一步的数据挖掘提供有效数据，推动建筑节能工作的开展。

全部详细技术资料下载

【技术实现步骤摘要】
一种办公建筑逐时能耗异常数据在线识别与填补方法
本专利技术涉及能耗数据预处理
，特别涉及一种办公建筑逐时能耗异常数据在线识别与填补方法。
技术介绍
我国自2007年起相继制定和颁布了一系列政策法规和相应的技术导则，开展国家机关办公建筑和大型公共建筑能耗监管体系建设，截止2015年底，北京、上海、天津、深圳等31个省市已建成了联网的国家机关办公建筑和大型公共建筑动态能耗监测平台。办公建筑节能是建设绿色智慧城市的重要内容。办公建筑能耗数据是办公建筑能耗基准评估、用能评价、节能改造的基础，其数据质量严重影响办公建筑节能工作的开展。办公建筑能耗数据在采集、通信、传输、存储等各个环节容易受到噪声干扰、传感器失效、通信中断等多种因素的影响，产生大量缺失、突变或非正常零值等各种异常，导致数据质量不高，直接影响办公建筑节能工作的开展。实时监测数据中的缺失数据大都通过数据插值的方法进行填补从而提高数据质量，降低数据缺失带来的影响。常用的插值方法有拉格朗日插值法、牛顿插值法、三次样条插值法。此外，张熙等人提出了一种周期性插值方法来进行含大段连续缺失数据的插补，效果良好；杨石等人提出了一种基于用能模式的智能数据补充方法，显著提高了连续数据缺失段的数据质量。拉格朗日插值法、牛顿插值法及三次样条法这三种插值方法在含随机单点缺失数据的逐时能耗数据中插值效果较为理想，但在含大段连续缺失的能耗数据中插值效果一般。因为这三种插值方法都是根据已有的真实数据进行公式插值，所以插值效果直接与已有真实数据量相关，当缺失数据连续且缺失数据量较大时，真实数据量相对较少，相关性弱，插值效果一般。而...
一种办公建筑逐时能耗异常数据在线识别与填补方法

【技术保护点】
一种办公建筑逐时能耗异常数据在线识别与填补方法，其特征在于，具体包括下述步骤：S1、历史数据用能模式分类及特征值提取：将历史能耗相关数据全部读入建筑历史逐时能耗数据矩阵，经数据初步清洗后，对清洗后的数据进行用能模式分类，并计算各用能模式数据集的特征值；S2、逐时能耗采集数据的在线识别与填补：读取当前时刻的能耗数据，进行用能模式匹配，对逐时能耗采集数据进行在线识别，并对异常数据进行修正填补；S3、用能模式特征值滚动修正，并把滚动修正后的特征值用于逐时能耗数据在线插补中。

【技术特征摘要】
1.一种办公建筑逐时能耗异常数据在线识别与填补方法，其特征在于，具体包括下述步骤：S1、历史数据用能模式分类及特征值提取：将历史能耗相关数据全部读入建筑历史逐时能耗数据矩阵，经数据初步清洗后，对清洗后的数据进行用能模式分类，并计算各用能模式数据集的特征值；S2、逐时能耗采集数据的在线识别与填补：读取当前时刻的能耗数据，进行用能模式匹配，对逐时能耗采集数据进行在线识别，并对异常数据进行修正填补；S3、用能模式特征值滚动修正，并把滚动修正后的特征值用于逐时能耗数据在线插补中。2.根据权利要求1所述的办公建筑逐时能耗异常数据在线识别与填补方法，其特征在于，在步骤S1中，所述历史数据用能模式分类及特征值提取包括下述步骤：S1.1、程序初始化，参数初始化，设程序将读取总共为M天/组的历史能耗相关数据，M为历史数据采集总天数，M(j1)＝M，M(j1)在步骤S1.3中用于记录含有j1时刻有效历史能耗数据的总天数，即除去j1时刻能耗数据为缺失数据的天数后的总天数，在程序初始化时M(j1)全部赋值为M，Q'(j1)＝0，Q'(j1)为初步清洗时各时刻的能耗累计值，j1为历史数据采集时刻，0≤j1≤23；S1.2、依次将M天/组的历史能耗相关数据全部读入建筑历史逐时能耗数据矩阵Q(i1,j1)、室外温度数据矩阵T(i1，j1)、以及当前日期DATA(i1)，其中，i1为历史数据采集天数，1≤i1≤M；S1.3、异常数据初步清洗，初步清洗逐时能耗突变数据和缺失数据，并将相应的异常数据剔除，统一作为缺失值处理；所述能耗突变数据为离群点；所述缺失数据属于空值，而不为0；S1.4、用能模式分类；用能模式的分类数量＝室外干球温度分类属性数量×时刻分类属性数量×日期分类属性数量；S1.5、根据逐时能耗数据的室外温度、时刻、以及日期属性，对初步清洗后的数据集进行分类，总共分成12个数据集，建立12种用能模式数据集的特征集，并计算不含缺失数据的各用能模式数据集的特征值，包括均值μ2(f)和标准差σ2(f),f＝1,2,…,12。3.根据权利要求2所述的办公建筑逐时能耗异常数据在线识别与填补方法，其特征在于，在步骤S1.3中，所述异常数据初步清洗的方法如下：S1.3.1、计算24个时刻历史能耗数据初始均值：(1.3.1.1)j1＝0，进入步骤(1.3.1.2)；(1.3.1.2)i1＝1，进入步骤(1.3.1.3)；(1.3.1.3)若Q(i1,j1)矩阵中某天某时刻能耗数值为空值，则判定Q(i1,j1)为异常数据即缺失数据，M(j1)＝M(j1)-1，否则，Q'(j1)＝Q'(j1)+Q(i1,j1)；进入步骤(1.3.1.4)；(1.3.1.4)i1＝i1+1，若i1≤M，则进入步骤(3)，否则，进入步骤(1.3.1.5)；(1.3.1.5)计算μ0(j1)，j1＝j1+1，若j1≤23，则进入步骤(1.3.1.2)，否则，进入下一步骤S1.3.2，进行标准差计算；S1.3.2、计算24个时刻历史能耗数据初始标准差：(1.3.2.1)j1＝0，进入步骤(1.3.2.2)；(1.3.2.2)i1＝1，进入步骤(1.3.2.3)；(1.3.2.3)若Q(i1,j1)矩阵中某天某时刻能耗数值不为空值，则Q″(j1)＝Q″(j1)+[Q(i1,j1)-μ0(j1)]2，进入步骤(1.3.2.4)；(1.3.2.4)i1＝i1+1，若i1≤M，则进入步骤(1.3.2.3)，否则，进入步骤(1.3.2.5)；(1.3.2.5)计算σ0(j1)，其中，M(j1)在上一步S1.3.1中已经进行计算；j1＝j1+1，若j1≤23，则进入步骤(1.3.2.2)，否则，进入下一步骤S1.3.3，进行突变数据清洗；S1.3.3、清洗突变数据：(1.3.3.1)j1＝0，进入步骤(1.3.3.2)；(1.3.3.2)i1＝1，进入步骤(1.3.3.3)；(1.3.3.3)若|Q(i1,j1)-μ0(j1)|＞3σ0(j1)，判定Q(i1,j1)为异常数据即突变数据，从数据集中去除该数据；进入步骤(1.3.3.4)；(1.3.3.4)i1＝i1+1，若i1≤M，则进入步骤(1.3.3.3)，否则，进入步骤(1.3.3.5)；(1.3.3.5)j1＝j1+1，若j1≤23，则进入步骤(1.3.3.2)，否则，进入下一步骤S1.4。4.根据权利要求2所述的办公建筑逐时能耗异常数据在线识别与填补方法，其特征在于，在步骤S1.4中，所述用能模式分类的具体方法如下：S1.4.1、室外温度分类，将办公建筑逐时能耗数据根据室外干球温度T的分类属性进行模式划分，分为三类：低温：T(i1,j1)＜T1；中温：T1＜T(i1,j1)＜T2；高温：T(i1,j1)＞T2；T1,T2通过k均值聚类的方法得出，具体数值为所分出类别的聚类中心；S1.4.2、工作日和休息日分类，办公建筑能耗数据受工作日和休息日影响较大，按日期分类属性将办公建筑能耗数据分为休息日和工作日两类；S1.4.3、上班时刻和下班时刻分类，办公建筑能耗较为规律，根据时刻分类属性将办公建筑能耗数据分为上班时刻和下班时刻两类。5.根据权利要求1所述的办公建筑逐时能耗异常数据在线识别与填补方法，其特征在于，在步骤S2中，所述逐时能耗采集数据的在线识别与填补的具体方法为：S2.1、参数设置初值：i2＝1，i3＝0，j2＝Time，D2(1)＝DATE，i2为数据在线采集的日期序号，i3用于记录连续异常数据的个数，j2为数据当前采集时刻，0≤j2≤23，Time为当前时刻，D2(i2)用于记录采集数据的日期，DATE为当前日期，已知电表初始读数Electricity0；S2.2、逐时数据采集：读取当前日期DATE，采集当前时刻电表读数Electricity(i2,j2)和当前室外干球温度Tem2(i...

【专利技术属性】
技术研发人员：周璇，崔少伟，周裕东，梁列全，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人