一种基于数据挖掘技术的公共建筑用电异常判别方法技术

技术编号:19481206 阅读:15 留言:0更新日期:2018-11-17 10:40
本发明专利技术公开了一种基于数据挖掘技术的公共建筑用电异常判别方法,包括下列步骤:S1,对历史用电数据库中的数据进行预处理并根据用户历史小时最高用电负荷x和用户历史小时平均用电负荷y建立特征向量[x,y],每个用户每个小时对应一个特征向量[x,y];S2,对所有特征向量[x,y]进行K‑means聚类分析,找到每个特征向量对应的聚类中心,每个聚类中心对应一个用电模式;S3,找到每个用电模式与其它用电模式的最优分裂属性以及最优分裂属性值,建立用电模式识别模型;S4,采集用户实时小时最高用电负荷X和用户实时小时平均用电负荷Y,判定对应的用户是否为用电异常用电户。

【技术实现步骤摘要】
一种基于数据挖掘技术的公共建筑用电异常判别方法
本专利技术涉及一种基于数据挖掘技术的公共建筑用电异常判别方法。
技术介绍
在经济全球化、全球变暖的大背景下,日益严重的能源形势得到了世界各地的高度重视。中国是世界上最大的发展中国家,近年来急剧增长的用电与资源相对短缺之间的矛盾严重制约了国家的发展。能源是经济社会发展的原动力,为了推动节能技术的进步,提高能源的利用效率,促进能源节约和优化用能结构,建设“资源节约型、环境友好型”两型社会,国家和各级省市政府相继出台了多项节能政策、法规,逐步形成具有中国特色的节能长效机制和管理体制。在线监测企业的水、电、油、气、热等能源的生产和使用情况,准确把握同一行业单位产品的平均用电水平,是政府科学地制定行业节能减排目标的重要依据。通过对企业及公用建筑等用能单位进行用电监测和能效评估,既可以帮助用能单位查找出自身耗能方面的缺口,让其在节能减排中有的放矢,不为了达到国家的节能目标而地拉闸限电,又为政府管理部门核定节能效益提供科学依据。工业用户及公共建筑的节能评估是一项复杂的系统工程,涉及国家节能相关法律、法规,行业节能设计标准,用能工艺、产品、设备选用,节能技术的适宜性等各个方面。除了一系列工程问题、技术问题之外,还包含管理决策等问题。在各个系统的节能评估和审查过程中,需要采用科学的评估方法进行分析。现行的主要评估方法包括标准对照法,类比工程分析法,专家经验判断法和单位面积指标法等。上述方法大都主观性较强,同时更侧重于从用能系统规划建设的角度进行分析,与其实际运行情况关联不大。目前应用的节能评估平台大都处于数据采集和统计展示的初级阶段,针对实时用能信息进行挖掘算法的研究工作开展不多。随着我国节能评估平台的建设推广,将会收集大量的用电数据,如何快速有效地从中分析挖掘出有价值的信息,进而发现用能单位的节能潜力,提出有效节能建议,对于提高能源资源利用效率,保障社会的可持续发展具有重要意义。随着大数据时代的到来和我国节能评估平台的建设推广,将会有海量的用电数据,方便利用数据挖掘技术对其进行分析并提出节能方案。深入开展高耗能企业电力能效监测和评估工作,一方面管理部门可以完善电能管理体系,充分挖掘节能潜力,采取有针对性的节能对策和措施,推动企业的节能减排工作。另一方面企业也可以深入了解自身存在的用电问题,针对这些问题实施具体节能措施,进一步根据成本效益分析,做出未来的用能行为规划,以达到企业和社会双赢目标。传统的节能评估与异常监测方法存在用电异常阈值难以确定和不能动态适应季节、气候、地区环境特征等因素的问题。目前也有一些智能监测方法,但往往只是基于历史数据对用电进行静态分析。
技术实现思路
本专利技术的目的是为了克服现有技术的不足,提供一种基于数据挖掘技术的公共建筑用电异常判别方法,其对用电模式进行聚类分析并对未来的用电数据进行实时模式识别,可以实现对用户用电的异常监测,同时实现对用能数据价值的有效发掘与充分利用,并提高企业节能决策理论水平。实现上述目的的一种技术方案是:一种基于数据挖掘技术的公共建筑用电异常判别方法,包括下列步骤:S1,对历史用电数据库中的缺失数据和超出阈值范围的数据用对应字段平均值进行替代,并根据用户历史小时最高用电负荷x和用户历史小时平均用电负荷y建立特征向量[x,y],每个用户每个小时对应一个特征向量[x,y];S2,对所有特征向量[x,y]进行K-means聚类分析,找到每个特征向量对应的聚类中心,每个聚类中心对应一个用电模式;S3,根据基于CART算法的决策树,找到每个用电模式与其它用电模式的最优分裂属性以及最优分裂属性值,建立用电模式识别模型;S4,用电异常监测步骤,采集用户实时小时最高用电负荷X和用户实时小时平均用电负荷Y,建立每个用户所对应的实时特征向量[X,Y],根据所述用电模式识别模型,确定所述实时特征向量[X,Y]所对应的用电模式,用局部离群因子检测方法判定该实时特征向量[X,Y]的离群程度,根据离群程度确定该实时特征向量[X,Y]所对应的用户是否为用电异常用电户。进一步的,S2步骤中,先对所有特征向量[x,y]进行规范化,得到规范化特征向量z=[zx,zy],再对规范化特征向量z=[zx,zy]进行K-means聚类分析,规范化的公式为:μ(x)和μ(y)分别代表任一历史采集时间点,所有用户的用户历史小时最高用电负荷的平均值和所有用户的用户历史小时平均用电负荷的平均值,σ(x)和σ(y)分别代表该历史采集时间点,所有用户的用户历史小时最高用电负荷的标准差和所有用户的用户历史小时平均用电负荷的标准差;S4步骤中先对所述实时特征向量[X,Y]进行规范化,得到实时规范化特征向量Z=[ZX,ZY],再用局部离群因子检测方法判定所述实时规范化特征向量Z=[ZX,ZY]离群程度;其中μ(X)和μ(Y)分别代表所有用户的用户实时小时最高用电负荷的平均值和所有用户的用户实时小时平均用电负荷的平均值,σ(X)和σ(Y)分别代表所有用户的用户实时小时最高用电负荷的标准差和所有用户的用户实时小时平均用电负荷的标准差。再进一步的,S2步骤中对规范化特征向量z=[zx,zy]进行K-means聚类分析的具体步骤为:S21,在以用户小时最高用电负荷为横坐标,用户小时平均用电负荷为纵坐标的直角坐标系中,拾取k个聚类中心ui(j),其中j=0,i=1,2,……,k;S22,选取n个规范化特征向量,记为zt,其中t=1,2,……,n,计算每个zt到每个聚类中心ui(j)的欧式距离;S23,找出关于每个zt最小欧式距离的聚类中心ui(j),zt进入该聚类中心所对应的簇,并将每个簇的几何中心记为新聚类中心ui(j+1);S24,计算所有zt关于与其所在簇对应的新聚类中心ui(j+1)的欧式距离的平方误差Ej,判定平方误差Ej是否在设定值范围内;S25,若平方误差Ej在设定值范围内,则输出当前所有的聚类中心ui(j+1),以及对应簇内的所有规范化特征向量zt,每个聚类中心作为一个用电模式;S26,若平方误差Ej不在设定值范围内,则令j=j+1,并返回步骤S23。更进一步的,S3步骤中对由规范化特征向量zt,其中t=1,2,……,n,所构成的样本集S,以Gain_GINI的值最小的属性与属性值作为最优分裂属性以及最优分裂属性值。还要进一步的,对于样本集S,其中oi表示分类结果中第i个用电模式出现的概率;根据用户历史小时最高用电负荷将样本集S划分成两部分,Gain_GINI计算如下:最优二分方案为还要进一步的,对于样本集S,其中oi表示分类结果中第i个用电模式出现的概率;根据用户历史小时平均用电负荷将样本集S划分成两部分,Gain_GINI计算如下:最优二分方案为再进一步的,对于任意一个对象p,即一个实时规范化特征向量Z=[ZX,ZY];将p的k距离记作k-distance(p),在样本集S中,存在对象o,对象p相对于对象o的可达距离为:reachdist(p,o)=max{k-distance(o),||p-o||};则对应p的局部可达密度为:局部离群点因子定义如下:若LOFk(p)的值大于阈值,则判定该实时规范化特征向量所对应的用户用电异常。进一步的,S1步骤、S2步骤和S3步骤定本文档来自技高网
...

【技术保护点】
1.一种基于数据挖掘技术的公共建筑用电异常判别方法,包括下列步骤:S1,对历史用电数据库中的缺失数据和超出阈值范围的数据用对应字段平均值进行替代,并根据用户历史小时最高用电负荷x和用户历史小时平均用电负荷y建立特征向量[x,y],每个用户每个小时对应一个特征向量[x,y];S2,对所有特征向量[x,y]进行K‑means聚类分析,找到每个特征向量对应的聚类中心,每个聚类中心对应一个用电模式;S3,根据基于CART算法的决策树,找到每个用电模式与其它用电模式的最优分裂属性以及最优分裂属性值,建立用电模式识别模型;S4,用电异常监测步骤,采集用户实时小时最高用电负荷X和用户实时小时平均用电负荷Y,建立每个用户所对应的实时特征向量[X,Y],根据所述用电模式识别模型,确定所述实时特征向量[X,Y]所对应的用电模式,用局部离群因子检测方法判定该实时特征向量[X,Y]的离群程度,根据离群程度确定该实时特征向量[X,Y]所对应的用户是否为用电异常用电户。

【技术特征摘要】
1.一种基于数据挖掘技术的公共建筑用电异常判别方法,包括下列步骤:S1,对历史用电数据库中的缺失数据和超出阈值范围的数据用对应字段平均值进行替代,并根据用户历史小时最高用电负荷x和用户历史小时平均用电负荷y建立特征向量[x,y],每个用户每个小时对应一个特征向量[x,y];S2,对所有特征向量[x,y]进行K-means聚类分析,找到每个特征向量对应的聚类中心,每个聚类中心对应一个用电模式;S3,根据基于CART算法的决策树,找到每个用电模式与其它用电模式的最优分裂属性以及最优分裂属性值,建立用电模式识别模型;S4,用电异常监测步骤,采集用户实时小时最高用电负荷X和用户实时小时平均用电负荷Y,建立每个用户所对应的实时特征向量[X,Y],根据所述用电模式识别模型,确定所述实时特征向量[X,Y]所对应的用电模式,用局部离群因子检测方法判定该实时特征向量[X,Y]的离群程度,根据离群程度确定该实时特征向量[X,Y]所对应的用户是否为用电异常用电户。2.根据权利要求1所述的一种基于数据挖掘技术的公共建筑用电异常判别方法,其特征在于:S2步骤中,先对所有特征向量[x,y]进行规范化,得到规范化特征向量z=[zx,zy],再对规范化特征向量z=[zx,zy]进行K-means聚类分析,规范化的公式为:和μ(x)和μ(y)分别代表任一历史采集时间点,所有用户的用户历史小时最高用电负荷的平均值和所有用户的用户历史小时平均用电负荷的平均值,σ(x)和σ(y)分别代表该历史采集时间点,所有用户的用户历史小时最高用电负荷的标准差和所有用户的用户历史小时平均用电负荷的标准差;S4步骤中先对所述实时特征向量[X,Y]进行规范化,得到实时规范化特征向量Z=[ZX,ZY],再用局部离群因子检测方法判定所述实时规范化特征向量Z=[ZX,ZY]离群程度;其中μ(X)和μ(Y)分别代表所有用户的用户实时小时最高用电负荷的平均值和所有用户的用户实时小时平均用电负荷的平均值,σ(X)和σ(Y)分别代表所有用户的用户实时小时最高用电负荷的标准差和所有用户的用户实时小时平均用电负荷的标准差。3.根据权利要求2所述的一种基于数据挖掘技术的公共建筑用电异常判别方法,其特征在于:S2步骤中对规范化特征向量z=[zx,zy]进行K-means聚类分析的具体步骤为:S21,在以用户小时最高用电负荷为横坐标,用户小时平均...

【专利技术属性】
技术研发人员:范华东施振国杨华惠施春波施勇郭佳田胡蕊徐卫林王婧
申请(专利权)人:国网上海市电力公司上海电力实业有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1