一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法技术

技术编号：40165552 阅读：8 留言：0更新日期：2024-01-26 23:37

本发明专利技术提出一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法，属于暖通空调节能降碳技术领域。该方法包括获取室外气象数据和供热数据构成的供热影响因素数据以及历史热负荷数据(供热量数据)；运用随机森林多重插补模型等方法进行数据预处理；运用皮尔逊相关性分析法和傅里叶距离的模糊C‑均值聚类对供热影响因素数据和供热量数据进行分析，得出主要的影响因素；运用CNN‑BiLSTM模型热负荷预测模型，最终实现热负荷预测。本发明专利技术采取以上技术方案，在分析已有数据的前提下，得出热负荷预测算法模型，进而可以结合新供热数据预测所需热负荷，从而对供热的控制提供指导。本发明专利技术所构建的模型具有较高的泛化性和可靠性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术专利涉及数据挖掘技术，具体涉及一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法。

技术介绍

1、数据挖掘是一种基于多种机器学习算法对数据进行分析的技术，基于机器学习的算法相比于基于物理模型的方法的优势在于更加灵活，该技术需要运用机器学习算法对历史数据进行分析，基于机器学习的方法在建筑短期供热负荷预测中效果很好，且非线性预测技术优于线性预测技术。

2、目前，随着物联网技术的发展，供热站搭建了既有监测又有数据采集的智慧系统平台，随着系统的运行，积累了大量有价值的运行数据。一般统计分析法可以利用先有的经验专业知识来实现数据规律的归纳和总结。然而，通过统计分析的方法所挖掘的信息是有限的。特别是在面对数据量大、时效性、低质量、高维的换热站运行数据集时，统计方法表现出较差的性能。因此，需要更先进的数学方法来处理集中供热系统大数据的复杂性和低质量，以实现对这些运行数据背后隐藏特性的提取，并有助于对现有监测策略进行更精确调整，准确的热负荷预测可以对供热控制策略的优化提供指导性的建议。

3、基于此，本专利技术设计了一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法，以解决上述问题。

技术实现思路

1、本专利技术的目的在于提供一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法，以解决上述
技术介绍
中提出的问题。

2、为实现上述目的，本专利技术提供如下技术方案：一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法，其包括以下几个步骤：</p>

3、(1)采集室外气象数据和供热数据构成的供热影响因素数据以及历史热负荷数据(供热量数据)作为样本数据集；

4、(2)运用随机森林多重插补模型、箱线图法(四分位数法)、临近均值替代法对供热影响因素数据和供热量数据进行数据预处理；

5、(3)运用皮尔逊相关性分析法对供热影响因素数据和供热量数据进行相关性分析；

6、(4)运用傅里叶距离的模糊c-均值聚类对供热影响因素数据和供热量数据进行聚类分析；运用肘部法确定聚类所需的聚类数；

7、(5)运用cnn-bilstm模型搭建单特征的长期热负荷预测和多特征的短期热负荷预测模型；

8、(6)使用热负荷预测模型进行单特征的长期热负荷预测和多特征的短期热负荷预测。

9、所述步骤(1)采集室外气象数据和供热数据构成的供热影响因素数据以及历史热负荷数据(供热量数据)作为样本数据集。

10、所述步骤(2)，基于所述步骤(1)的数据，箱线图法(四分位数法)用于识别原始数据的过大值和过小值。随机森林多重插补模型为填充缺失率在5％-30％的缺失值的方法。临近均值替代法为填充缺失率小于5％的缺失值的方法。随机森林多重插补模型、箱线图法(四分位数法)和临近均值替代法用于对原始数据进行预处理的方法。

11、所述步骤(3)，基于所述步骤(2)预处理后的数据，皮尔逊相关性分析法是指两个随机变量x和y之间的线性相关性的度量，用来反映两个正态连续变量之间的线性相关性，本专利技术中用于分析供热影响因素与供热量的相关性，从而确定对供热量影响大的几种影响因素。

12、所述步骤(4)，基于所述步骤(2)与处理后的数据，傅里叶距离的模糊c-均值聚类用于聚类供热长短期和供热季初寒期、严寒期和末寒期影响供热量的各影响因素，得到初寒期、严寒期和末寒期的影响因素权重，从而确定对供热量影响大的几种影响因素，并对筛选出的几种影响因素与供热量查看所述步骤(3)皮尔逊相关性分析结果，从而确定这几种影响因素对供热量影响的程度，最终确定几种对供热量影响程度最大的几种影响因素进行负荷预测。肘部法采用手肘法用于确定聚类数。

13、所述步骤(5)，基于所述步骤(3)和所述步骤(4)处理后的数据，运用bp、lstm、cnn、cnn-lstm和cnn-bilstm模型根据相关性分析和聚类分析的结果进行多特征热负荷预测，利用平均绝对误差mae、均方根误差rmse、平均绝对百分比误差mape和决定系数r2四种评价指标来综合评价模型的预测结果，确定最佳的模型，采用cnn-bilstm模型进行热负荷的预测模型的搭建。其中单特征的长期热负荷预测运用历史热负荷数据进行模型的训练并预测长期的热负荷，多特征的短期热负荷预测运用基于权利5要求筛选出的影响因素进行模型的训练并预测短期的热负荷，最终导出长短期热负荷预测模型。

14、所述步骤(6)，基于所述步骤(5)搭建的热负荷预测模型，对新采集的数据带入步骤(6)进行热负荷预测。

15、与现有技术相比，本专利技术的有益效果是：

16、1、本专利技术采用物联网大数据技术采集室外气象数据和供热数据，所采集的数据真实可靠，其实时更新性使得数据分析更加便利。

17、2、运用随机森林多重插补模型、箱线图法(四分位数法)、临近均值替代法对供热影响因素数据和供热量数据进行数据预处理，消除数据中的异常值和缺失值，提高数据的准确性，为后续的数据分析和热负荷预测提供可靠的数据，提高数据分析结果和热负荷预测结果的可信度和准确性。

18、3、运用皮尔逊相关性分析法和傅里叶距离的模糊c-均值聚类对数据进行相关性分析和聚类分析，筛选出对供热量影响大的几种影响因素，随后采用cnn-bilstm模型进行热负荷预测模型的搭建，最后对新采集的数据进行负荷预测。

19、4、数据挖掘技术相比于基于物理模型的方法的优势在于更加灵活，数据挖掘技术还可以实现对这些运行数据背后隐藏特性的提取，并有助于对现有监测策略进行更精确调整，准确的短期热负荷预测可以对供热控制策略的优化提供指导性的建议。准确的长期热负荷预测可以对供热能耗需求的满足提供指导性的建议。

本文档来自技高网...

【技术保护点】

1.一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法，其包括以下几个步骤：(1)采集室外气象数据和供热数据构成的供热影响因素数据以及历史热负荷数据(供热量数据)作为样本数据集；

2.根据权利要求1的一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法，其特征在于：所述步骤(1)采集室外气象数据和供热数据构成的供热影响因素数据以及历史热负荷数据(供热量数据)作为样本数据集。

3.根据权利要求1的一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法，其特征在于：所述步骤(2)，基于所述步骤(1)的数据，箱线图法(四分位数法)用于识别原始数据的过大值和过小值。随机森林多重插补模型为填充缺失率在5％-30％的缺失值的方法。临近均值替代法为填充缺失率小于5％的缺失值的方法。随机森林多重插补模型、箱线图法(四分位数法)和临近均值替代法用于对原始数据进行预处理的方法。

4.根据权利要求1的一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法，其特征在于：所述步骤(3)，基于所述步骤(2)预处理后的数据，皮尔逊相关性分析法是指两个随机变量X

5.根据权利要求1的一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法，其特征在于：所述步骤(4)，基于所述步骤(2)与处理后的数据，傅里叶距离的模糊C-均值聚类用于聚类供热长短期和供热季初寒期、严寒期和末寒期影响供热量的各影响因素，得到初寒期、严寒期和末寒期的影响因素权重，从而确定对供热量影响大的几种影响因素，并对筛选出的几种影响因素与供热量查看所述步骤(3)皮尔逊相关性分析结果，从而确定这几种影响因素对供热量影响的程度，最终确定几种对供热量影响程度最大的几种影响因素进行负荷预测。肘部法采用手肘法用于确定聚类数。

6.根据权利要求1的一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法，其特征在于：所述步骤(5)，基于所述步骤(3)和所述步骤(4)处理后的数据，运用BP、LSTM、CNN、CNN-LSTM和CNN-BiLSTM模型根据相关性分析和聚类分析的结果进行多特征热负荷预测，利用平均绝对误差MAE、均方根误差RMSE、平均绝对百分比误差MAPE和决定系数R2四种评价指标来综合评价模型的预测结果，确定最佳的模型，采用CNN-BiLSTM模型进行热负荷的预测模型的搭建。其中单特征的长期热负荷预测运用历史热负荷数据进行模型的训练并预测长期的热负荷，多特征的短期热负荷预测运用基于权利要求5筛选出的影响因素进行模型的训练并预测短期的热负荷，最终导出长短期热负荷预测模型。

7.根据权利要求1的一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法，其特征在于：所述步骤(6)，基于所述步骤(5)搭建的热负荷预测模型，对新采集的数据带入步骤(6)进行热负荷预测。

...

【技术特征摘要】

4.根据权利要求1的一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法，其特征在于：所述步骤(3)，基于所述步骤(2)预处理后的数据，皮尔逊相关性分析法是指两个随机变量x和y之间的线性相关性的度量，用来反映两个正态连续变量之间的线性相关性，本发明中用于分析供热影响因素与供热量的相关性，从而确定对供热量影响大的几种影响因素。

5.根据权利要求1的一种基于多种机器学习算法组合的数据挖掘技术热负荷预测方法，其特征在于：所述步骤(4)，基于所述步骤(2)与...

【专利技术属性】
技术研发人员：由玉文，刘志豪，王中华，郭春梅，杨斌，
申请(专利权)人：天津城建大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人