System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术专利涉及数据挖掘技术,具体涉及一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法。
技术介绍
1、数据挖掘是一种基于多种机器学习算法对数据进行分析的技术,基于机器学习的算法相比于基于物理模型的方法的优势在于更加灵活,该技术需要运用机器学习算法对历史数据进行分析,基于机器学习的方法在建筑短期供热负荷预测中效果很好,且非线性预测技术优于线性预测技术。
2、目前,随着物联网技术的发展,供热站搭建了既有监测又有数据采集的智慧系统平台,随着系统的运行,积累了大量有价值的运行数据。一般统计分析法可以利用先有的经验专业知识来实现数据规律的归纳和总结。然而,通过统计分析的方法所挖掘的信息是有限的。特别是在面对数据量大、时效性、低质量、高维的换热站运行数据集时,统计方法表现出较差的性能。因此,需要更先进的数学方法来处理集中供热系统大数据的复杂性和低质量,以实现对这些运行数据背后隐藏特性的提取,并有助于对现有监测策略进行更精确调整,准确的热负荷预测可以对供热控制策略的优化提供指导性的建议。
3、基于此,本专利技术设计了一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法,以解决上述问题。
技术实现思路
1、本专利技术的目的在于提供一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法,以解决上述
技术介绍
中提出的问题。
2、为实现上述目的,本专利技术提供如下技术方案:一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法,其包括以下几个步骤:<
...【技术保护点】
1.一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法,其包括以下几个步骤:(1)采集室外气象数据和供热数据构成的供热影响因素数据以及历史热负荷数据(供热量数据)作为样本数据集;
2.根据权利要求1的一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法,其特征在于:所述步骤(1)采集室外气象数据和供热数据构成的供热影响因素数据以及历史热负荷数据(供热量数据)作为样本数据集。
3.根据权利要求1的一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法,其特征在于:所述步骤(2),基于所述步骤(1)的数据,箱线图法(四分位数法)用于识别原始数据的过大值和过小值。随机森林多重插补模型为填充缺失率在5%-30%的缺失值的方法。临近均值替代法为填充缺失率小于5%的缺失值的方法。随机森林多重插补模型、箱线图法(四分位数法)和临近均值替代法用于对原始数据进行预处理的方法。
4.根据权利要求1的一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法,其特征在于:所述步骤(3),基于所述步骤(2)预处理后的数据,皮尔逊相关性分析法是指两个随机变量X
5.根据权利要求1的一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法,其特征在于:所述步骤(4),基于所述步骤(2)与处理后的数据,傅里叶距离的模糊C-均值聚类用于聚类供热长短期和供热季初寒期、严寒期和末寒期影响供热量的各影响因素,得到初寒期、严寒期和末寒期的影响因素权重,从而确定对供热量影响大的几种影响因素,并对筛选出的几种影响因素与供热量查看所述步骤(3)皮尔逊相关性分析结果,从而确定这几种影响因素对供热量影响的程度,最终确定几种对供热量影响程度最大的几种影响因素进行负荷预测。肘部法采用手肘法用于确定聚类数。
6.根据权利要求1的一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法,其特征在于:所述步骤(5),基于所述步骤(3)和所述步骤(4)处理后的数据,运用BP、LSTM、CNN、CNN-LSTM和CNN-BiLSTM模型根据相关性分析和聚类分析的结果进行多特征热负荷预测,利用平均绝对误差MAE、均方根误差RMSE、平均绝对百分比误差MAPE和决定系数R2四种评价指标来综合评价模型的预测结果,确定最佳的模型,采用CNN-BiLSTM模型进行热负荷的预测模型的搭建。其中单特征的长期热负荷预测运用历史热负荷数据进行模型的训练并预测长期的热负荷,多特征的短期热负荷预测运用基于权利要求5筛选出的影响因素进行模型的训练并预测短期的热负荷,最终导出长短期热负荷预测模型。
7.根据权利要求1的一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法,其特征在于:所述步骤(6),基于所述步骤(5)搭建的热负荷预测模型,对新采集的数据带入步骤(6)进行热负荷预测。
...【技术特征摘要】
1.一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法,其包括以下几个步骤:(1)采集室外气象数据和供热数据构成的供热影响因素数据以及历史热负荷数据(供热量数据)作为样本数据集;
2.根据权利要求1的一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法,其特征在于:所述步骤(1)采集室外气象数据和供热数据构成的供热影响因素数据以及历史热负荷数据(供热量数据)作为样本数据集。
3.根据权利要求1的一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法,其特征在于:所述步骤(2),基于所述步骤(1)的数据,箱线图法(四分位数法)用于识别原始数据的过大值和过小值。随机森林多重插补模型为填充缺失率在5%-30%的缺失值的方法。临近均值替代法为填充缺失率小于5%的缺失值的方法。随机森林多重插补模型、箱线图法(四分位数法)和临近均值替代法用于对原始数据进行预处理的方法。
4.根据权利要求1的一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法,其特征在于:所述步骤(3),基于所述步骤(2)预处理后的数据,皮尔逊相关性分析法是指两个随机变量x和y之间的线性相关性的度量,用来反映两个正态连续变量之间的线性相关性,本发明中用于分析供热影响因素与供热量的相关性,从而确定对供热量影响大的几种影响因素。
5.根据权利要求1的一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法,其特征在于:所述步骤(4),基于所述步骤(2)与...
【专利技术属性】
技术研发人员:由玉文,刘志豪,王中华,郭春梅,杨斌,
申请(专利权)人:天津城建大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。