基于大数据的日用水量预测方法技术

技术编号:24331988 阅读:66 留言:0更新日期:2020-05-29 20:04
本发明专利技术涉及大数据技术领域,公开了一种基于大数据的日用水量预测方法,包括步骤:S1:对包括日用水量、天气、温度、风速、降雨量的历史数据集进行预处理;S2:对预处理后的历史数据集进行特征构建,以提取时间特征、基础统计特征、延迟特征和组合特征;S3:将构建好的历史数据集输入多个机器学习模型分别进行单模型训练;S4:采用均方根误差在0.02~0.03之间,且两两单模型的均方根误差之间的差值不超过其中一个单模型的均方根误差的10%的多个单模型进行模型进行融合,以得组合模型,且使组合模型的均方根误差在0.02~0.03之间;S5:将下一天的日用水量数据按步骤S1和S2处理后带入组合模型,以预测下一天的日用水量。本发明专利技术能够较准确预测下一天的日用水量。

Prediction method of daily water consumption based on big data

【技术实现步骤摘要】
基于大数据的日用水量预测方法
本专利技术涉及大数据应用
,特别涉及一种基于大数据的日用水量预测方法。
技术介绍
在任何短期或者长期的计划中,城市需水量预测都是至关重要的一个环节。随着人口的增长、全球变暖,在经济快速发展的城市对用水的需求变化大,并且现在水资源匮乏,因此,现在许多国家都面临水资源断缺的问题,所以水资源的规划和管理很重要。城市用水量预测在城市建设规划、输配水系统的优化调度中具有重要的作用,天气、季节、节假日及不可预见因素对短期用水量影响比较大,而其它因素对长期的用水量影响比较大。水需求预测对于帮助决策者做出更好的决策并启发他们进行水资源分配以最大化长期价值和可用资源的可靠性所需的资本投资非常重要。目前日用水量预测大致可以分为三类:第一类为时间序列预测法,仅依赖历史数据进行建模预测,比如自回归法等;第二类为结构分析法,除利用历史数据外,还需要考虑与用水量相关的其他因素,但该方法要求给出各种影响因素与用水量之间的显示关系,然而这种关系并不容易得到;第三类是系统方法,与结构分析法类似,使用多种用水量的影响因素及历史数据,采用本文档来自技高网...

【技术保护点】
1.一种基于大数据的日用水量预测方法,其特征在于,包括步骤:/nS1:对包括日用水量、天气、温度、风速、降雨量的历史数据集进行预处理;/nS2:对预处理后的历史数据集进行特征构建,以提取时间特征、基础统计特征、延迟特征和组合特征;/nS3:将构建好的历史数据集输入多个机器学习模型分别进行单模型训练;/nS4:采用均方根误差在0.02~0.03之间,且两两单模型的均方根误差之间的差值不超过其中一个单模型的均方根误差的10%的多个单模型进行模型进行融合,以得组合模型,且使所述组合模型的均方根误差在0.02~0.03之间;/nS5:将下一天的日用水量数据按步骤S1和S2处理后带入所述组合模型,以预测...

【技术特征摘要】
1.一种基于大数据的日用水量预测方法,其特征在于,包括步骤:
S1:对包括日用水量、天气、温度、风速、降雨量的历史数据集进行预处理;
S2:对预处理后的历史数据集进行特征构建,以提取时间特征、基础统计特征、延迟特征和组合特征;
S3:将构建好的历史数据集输入多个机器学习模型分别进行单模型训练;
S4:采用均方根误差在0.02~0.03之间,且两两单模型的均方根误差之间的差值不超过其中一个单模型的均方根误差的10%的多个单模型进行模型进行融合,以得组合模型,且使所述组合模型的均方根误差在0.02~0.03之间;
S5:将下一天的日用水量数据按步骤S1和S2处理后带入所述组合模型,以预测下一天的日用水量。


2.如权利要求1所述的基于大数据的日用水量预测方法,其特征在于,所述步骤S1中预处理包括:异常值处理、缺失值处理和重复值处理。


3.如权利要求2所述的基于大数据的日用水量预测方法,其特征在于,所述步骤S1中,对于日用水量的异常值处理方式为:用前一天和后一天的数据均值填充,对于日用水量的缺失值处理方式为:使用随机森林回归填补缺失值。


4.如权利要求1所述的基于大数据的日用水量预测方法,其特征在于,所述步骤S2包括:
构建基础特征:统计温度,计算日用水量的均值、方差、最大值、最小值和中位数,画出正态分布,作出温度与日用水量的分布曲线,统计天气、风速、风向的数量;
构建时间特征:对历史数据加入月份特征以及工作日或周末特征;
构建延迟特征:加入前面三天的...

【专利技术属性】
技术研发人员:白斌
申请(专利权)人:重庆森鑫炬科技有限公司
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1