当前位置: 首页 > 专利查询>天津大学专利>正文

基于层次聚类和神经网络的负荷预测输入特征筛选方法技术

技术编号:21893530 阅读:48 留言:0更新日期:2019-08-17 15:08
本发明专利技术公开了一种基于层次聚类和神经网络的负荷预测输入特征筛选方法,该方法利用层次聚类分析将包括负荷预测的原始数据集进行聚类,将数据集根据其特征分为不同的类,对每一类中的特征进行分析,利用神经网络对每一类中的不同特征的预测效果进行分析,最终剔除预测效果较差的特征,得到最终优化的建筑负荷预测的输入特征集。本发明专利技术可以对冗杂的负荷预测输入数据集进行筛选,降低负荷预测的复杂性,提高负荷预测的计算速度,同时保留数据集中的有效特征,保证负荷预测的准确性。

Input Feature Screening Method for Load Forecasting Based on Hierarchical Clustering and Neural Network

【技术实现步骤摘要】
基于层次聚类和神经网络的负荷预测输入特征筛选方法
本专利技术属于负荷预测域,具体涉及一种基于层次聚类和神经网络的负荷预测输入特征筛选方法及参数预测效果判断方法。
技术介绍
负荷预测通常包括电力负荷预测以及建筑中的冷热负荷预测,主要是指根据系统的特征及相关参数和一些影响负荷的相关因素,在满足一定精度要求的条件下,确定未来某特定时刻的负荷数据。负荷预测无论是在电力系统的经济性调控还是在建筑系统的优化控制方面都有重要的作用。针对电力系统,准确的负荷预测可以经济合理的安排电网内部发电机组的启停,保持电网运行的安全稳定性,有效的降低发电成本,提高经济效益和社会效益。对于建筑系统,准确的建筑冷热负荷预测,可以指导建筑内暖通空调系统的运行,尽量保持建筑系统供能量和建筑负荷的匹配,同时控制建筑设备在高效的状态下运行,提高系统的其经济性和可靠性。目前负荷预测中较为准确和高效的方法主要是基于数据驱动的机器学习方法,这种方法相比其他基于物理建模以及基于灰箱的预测方法,建模简单同时准确性较高。然而,要想通过机器学习的方法得到准确的负荷预测结果需要大量的数据对模型进行训练,而过多的输入数据会导致模型运算时间长,模型过拟合造成的泛化能力差等问题。因此需要有效的数据特征筛选方法对输入模型的数据进行降维,同时这种方法需要在降低输入数据维度的同时尽量保证负荷预测的关键性数据特征完整,避免对负荷预测的准确性造成过大的影响。目前负荷预测的输入数据的处理方法主要是根据数据的统计性特征,如相关性分析等对数据进行特征筛选和降维。然而,统计性特征与负荷预测准确性的关系尚不明确,通过这种方法可能造成预测的关键特征被剔除而导致负荷预测的结果准确性下降。因此如何在数据处理的过程中降低输入数据的维度,同时尽量保证机器学习的负荷预测中的关键性特征不被剔除,是目前迫切解决的技术问题
技术实现思路
为克服上述现有技术的不足,本专利技术提供了一种基于聚类分析和神经网络的负荷预测输入特征的筛选方法,所述方法对负荷预测的原始数据进行层次聚类分析;利用神经网络对同一类中不同参数的预测效果进行判断,剔除预测效果不好的参数,得到优化的负荷预测输入特征集。相比现有其他负荷预测输入数据处理方法,得到的特征集更适应基于机器学习的负荷预测方法,并且能较好的保证负荷预测的结果的准确性。为实现上述目的,本专利技术的技术方案:一种基于层次聚类和神经网络的负荷预测输入特征筛选方法,包括以下步骤:对负荷预测的原始数据进行层次聚类分析,得到负荷预测输入数据的有层次的嵌套聚类树;根据层次聚类中的簇间距离确定建筑负荷预测输入参数聚类簇个数;利用神经网络对每一类的数据中不同参数的预测效果进行判断,剔除预测较差的参数,得到优化的负荷预测输入特征集。进一步的,所述层次聚类采用“自底向上”的聚合策略,将数据集中每一个样本看作一个初始聚类簇,每一步聚合将距离最近的两个聚类簇进行合并,不断重复直到聚合为一个聚类簇。进一步的,所述距离函数采用欧氏距离函数,对样本xi=(xi1;xi2;…;xi3)和xj=(xj1;xj2;…;xj3),距离函数dist(·,·)为:进一步的,所述簇间距离采用平均距离进行计算,对于给定聚类簇Ci和Cj,簇间距离为:利用聚类过程中每次聚合所采用的簇间距离之间的大小关系作为选取最终聚类簇个数的依据,根据簇间距离小形成的聚类簇的相似性大,类间距离大形成的类的相似性小的原则,若该次聚合所采用的簇间距离的增加值明显比之前聚合时的簇间距离大,则将该次聚合前的聚类簇数即为最终所分聚类的聚类簇数。进一步的,基于神经网络的参数预测效果判断方法为:(1)针对每一聚类簇内的不同参数建立测试集,测试集内包含该参数所在聚类簇外的其他聚类簇的全部参数,不包含该聚类簇内除该参数外的其他参数;(2)对每一个测试集针对同一个预测目标建立结构相同的神经网络模型;(3)将神经网络的预测结果作为评价对应参数的预测效果的依据;(4)利用均方根误差(RMSE)、平均绝对误差(MAE)、确定性系数(R2)和均方根误差变异系数(CV-RMSE)作为对不同参数的预测效果的评价指标,计算方法定义如下:其中:Fi——实际测量值;Fi′——模型预测值。进一步的,剔除每一聚类簇中预测效果最不好的神经网络模型对应的参数,得到最终的优化的负荷预测输入数据集。有益效果(1)本专利技术基于聚类分析对负荷预测输入数据进行分类,同一类中的数据特征具有一定的相似性,剔除其中的部分数据,剩余数据依然会保留其一部分特征,因此在聚类的基础上对数据进行筛选剔除对数据特征的多样性影响较小,对负荷预测的准确性影响较小。(2)本专利技术基于神经网络对不同参数的预测效果进行评价,评价结果能很好的适应基于机器学习的负荷预测模型,这种方法相比于基于数据统计参数的数据特征筛选方法能较好的保留有利于负荷预测模型的数据特征,保证负荷预测的准确性。附图说明图1为本专利技术基于层次聚类和神经网络的负荷预测输入特征筛选方法的流程图;图2为本专利技术实施例中数据及其名称的对应图;图3为本专利技术实施例中的层次聚类分析结果;图4为本专利技术实施例中层次聚类中的凝聚状态表格图;图5为本专利技术实施例中神经网络对负荷预测输入数据预测效果评价表格图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术作进一步的详细说明。如图1所示,本实施例提供一种基于聚类分析和神经网络的负荷预测输入特征筛选方法,包括以下步骤:步骤1:采用“自底向上”的层次聚类方法,将负荷预测的输入参数聚类形成有层次的嵌套聚类树。选择作为案例的是针对建筑负荷的预测模型的输入数据的特征筛选分体,对建筑负荷预测的输入数据通常包括建筑内扰参数(如:建筑内人员数量、建筑内设备开启情况等),建筑外扰参数(如:室外温度、室外湿度、太阳负荷值等),参数历史值。由于建筑围护结构的热惰性,建筑负荷具有延迟的特征,相关参数以及负荷数据的历史值对建筑负荷的预测有很重要的作用。本实施例中的所包括的输入数据具体见图2。将每一个输入数据作为一个初始聚类簇,对所有的聚类簇之间的欧氏距离进行计算,计算公式如下:其中,xi和xj为初始聚类簇;dist(xi,xj)为初始聚类簇的欧氏距离。将欧氏距离最小的两个数据合并为一个聚类簇,记录该欧氏距离。针对新形成的聚类簇之间重新计算欧氏距离,针对聚合形成的聚类簇计算欧氏距离时利用平均距离对簇间距离进行计算,计算公式如下:其中,Ci,Cj分别为不同的聚类簇,x,z分别为Ci,Cj中的数据。再次将簇间距离最小的聚类簇聚合成为一个簇,不断重复以上步骤,直到所有的数据聚合成为一个聚类簇,最终得到的聚类结果如图3来表示,每步聚合的数据和簇间距离如图4所示。图3中横坐标为样本编号,纵坐标为经过重新标度的聚类簇距离。步骤2:根据簇间距离确定最终的聚类簇的个数。根据聚类中每一步聚合中的两个聚类簇之间的簇间距离作为最终确定聚类簇个数的依据。实施例中每一步聚类的聚类簇编号以及簇间距离如图3所示,可知聚类过程总共经历11步将所有的初始聚类簇聚合为一类。通过对簇间距离的统计可知,随着聚类簇的不断凝聚,聚类簇的数目不断减少,簇间的距离在逐渐增大,在聚类进行到第9步之前,簇间距离增大的幅度较小,根据簇间距离小形成的聚类簇的相似本文档来自技高网
...

【技术保护点】
1.基于层次聚类和神经网络的负荷预测输入特征筛选方法,其特征在于,包括以下步骤:1)对负荷预测的原始数据进行层次聚类分析,得到负荷预测输入数据的有层次的嵌套聚类树;2)根据层次聚类中的簇间距离确定建筑负荷预测输入参数聚类簇个数;3)利用神经网络对每一类的数据中不同参数的预测效果进行判断,剔除预测较差的参数,得到优化的负荷预测输入特征集。

【技术特征摘要】
1.基于层次聚类和神经网络的负荷预测输入特征筛选方法,其特征在于,包括以下步骤:1)对负荷预测的原始数据进行层次聚类分析,得到负荷预测输入数据的有层次的嵌套聚类树;2)根据层次聚类中的簇间距离确定建筑负荷预测输入参数聚类簇个数;3)利用神经网络对每一类的数据中不同参数的预测效果进行判断,剔除预测较差的参数,得到优化的负荷预测输入特征集。2.根据权利1所述的基于层次聚类和神经网络的负荷预测输入特征筛选方法,其特征在于,所述层次聚类采用“自底向上”的聚合策略,将数据集中每一个样本看作一个初始聚类簇,每一步聚合将距离最近的两个聚类簇进行合并,不断重复直到聚合为一个聚类簇。3.根据权利2所述的基于层次聚类和神经网络的负荷预测输入特征筛选方法,其特征在于,所述距离函数采用欧氏距离函数,表达式如下:对样本xi=(xi1;xi2;…;xi3)和xj=(xj1;xj2;…;xj3),距离函数dist(·,·)为:4.根据权利2所述的基于层次聚类和神经网络的负荷预测输入特征筛选方法,其特征在于,所述簇间距离采用平均距离进行计算,表达式如下:对于给定聚类簇Ci和Cj,簇间距离为:5.根据权利1所述的基于层次聚类和神经网络的负荷预测输入特征筛选方法,其特征在于,利用聚类过程中...

【专利技术属性】
技术研发人员:丁研宿皓王翘楚张震勤
申请(专利权)人:天津大学
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1