当前位置: 首页 > 专利查询>郑保宁专利>正文

基于深度学习算法与混合整数线性规划相结合的水质波动区间预测方法技术

技术编号:16457337 阅读:35 留言:0更新日期:2017-10-25 21:25
本发明专利技术公开了一种基于深度学习算法与混合整数线性规划相结合的水质波动区间预测方法,属于水环境保护与监测研究领域。该方法首先将深度学习算法中的适用于时间序列数据预测的LSTM模型架构,引入到水质时间序列点预测的建模中;其次,考虑到尽管LSTM模型具有较强的时间序列预测性能,但其具有确定性预测方法的通病,即无法估计预测的不确定性,因此基于验证集样本LSTM点预测与真实值的偏差,考虑置信度参数,构造基于混合整数线性规划的区间预测通用模型,从而给出一定置信度下的水质波动区间的预测方法。该方法可以为水质预测提供一种新的解决方法,进而为水质预警提供可靠的评价与预警依据。

Interval prediction method of water quality fluctuation based on combination of deep learning algorithm and mixed integer linear programming

The invention discloses a water quality fluctuation interval prediction method based on deep learning algorithm and mixed integer linear programming, which belongs to the research field of water environment protection and monitoring. The architecture of LSTM model deep learning algorithm in the application in prediction of time series data, introduced to the time series of water quality prediction model; secondly, considering that although the LSTM model with time series predictive performance, but it has a common deterministic prediction method, which can estimate the forecast uncertainty. The deviation of the test sets LSTM point prediction and the real value based on the consideration of reliability parameters, structure prediction interval model based on mixed integer linear programming, forecasting method which gives a certain confidence interval of the fluctuation of water quality. This method can provide a new solution for water quality prediction, and provide reliable evaluation and early warning basis for water quality early warning.

【技术实现步骤摘要】
基于深度学习算法与混合整数线性规划相结合的水质波动区间预测方法
本专利技术涉及一种基于深度学习算法与混合整数线性规划相结合的水质波动区间预测方法,属于水环境保护与监测研究领域。
技术介绍
水是生命之源,人类在生活和生产活动中都离不开水。随着我国经济快速发展、人口的膨胀以及河流湖泊的自净能力下降,我国江河湖泊普遍遭受不同程度污染,全国75%的湖泊出现了不同程度的富营养化。水污染降低了水体的使用功能,加剧了水资源短缺,对我国可持续发展战略的实施带来了负面影响。根据水质监测历史数据,建立水质预测模型,准确地预测水体中污染物浓度随时间发展变化的趋势,不仅可以实现对水质的实时分析评价、预警,而且可以有效控制和减少水质恶化造成的危害,达到对水质恶化的有效认知、控制的目标,使整个水系的安全保障体系进入良性循环。及时有效的水质预测可以为水质预警提供可靠的评价及预警依据,是水环境管理和污染控制的基础工作,也是近年来水环境保护和监测科学领域的研究热点之一。水环境系统是一个受到生物、化学、物理、人为等多种因素影响的复杂系统,水质随时间非线性地变化,因此以传统方法很难建立一个精确的水质预测模型。然而,在一些局部水环境系统中,长期来看水质的变化是缓慢的、有规律可循的。另外,由于水质变化具有一定的随机不确定性,在实际应用中一定置信度下的区间预测能够提供有关不确定性的重要信息,有助于确定水质预测结果的可信度。
技术实现思路
本专利技术的目的在于针对现有技术的不足,提供一种水质波动区间预测方法,基于水质指标的历史时间序列数据,用深度学习和混合整数线性规划相结合的方法,对水质指标进行一定置信度下的精细的区间预测,从准确性和波动性两个角度进行预测。本专利技术的目的是通过以下技术方案来实现的:一种基于深度学习算法与混合整数线性规划相结合的水质波动区间预测方法,该方法包括以下步骤:(1)对水质历史数据进行预处理:修补缺失的历史数据,并进行归一化处理;将预处理后的数据分成相互独立的训练集和验证集;(2)利用步骤(1)中经过预处理后的训练集的水质数据时间序列,进行基于深度学习LSTM(LongShort-TermMemory)模型的点预测建模,得到点预测模型;(3)基于步骤(2)的点预测模型,利用步骤(1)中经过预处理后的验证集构造关于置信度c的基于混合整数线性规划的区间预测通用模型,通用模型的目标为最小化区间预测的平均相对区间宽度,目标函数如下:其中U(valid_pij)和L(valid_pij)为最优预测区间的上下边界,valid_pij为LSTM点预测值,valid_rij为真实值,N是验证集中的样本数量;约束条件如下:U(valid_pij)=valid_pij×αjL(valid_pij)=valid_pij×βj,L(valid_pij)=valid_rij+valid_rij×μi,1-valid_rij×μi,2U(valid_pij)=valid_rij+valid_rij×μi,3-valid_rij×μi,40≤μi,1≤Ii,10≤μi,2≤Ii,2Ii,1+Ii,2=10≤μi,3≤Ii,30≤μi,4≤Ii,4Ii,3+Ii,4=1其中αj和βj为在当前时刻t后的第j个时刻的最优预测区间的上下边界比例系数,满足αj>0,βj>0,αj>βj;μi,1,μi,2,μi,3,μi,4为连续型变量,Ii,1,Ii,2,Ii,3,Ii,4为Bool型变量;求解得到最优预测区间的上下边界比例系数αj和βj;(4)基于步骤(2)得到的点预测模型和步骤(3)得到的最优预测区间的上下边界比例系数,求得未来时刻的水质波动的区间预测值。进一步地,所述步骤(2)中,建立的点预测模型包含多隐含层、Relu激活函数和Dropout机制;并基于验证集确定最优的隐含层节点参数、Dropout比例、相关前置影响参数。本专利技术的有益效果是:基于水质指标的历史时间序列数据,用深度学习和混合整数线性规划的方法对水质进行区间预测,不仅可以为水质预警提供可靠的评价及预警依据,而且可以促进整个水系的安全保障体系进入良性循环。本专利技术提出的方法集成了LSTM时间序列预测方法的优势,同时通过混合整数线性规划方法弥补了LSTM确定性预测方法的劣势,此外最优区间预测的混合整数线性规划方法在求解上避免了智能寻优算法易陷入局部最优解的问题。附图说明图1为本专利技术方法整体流程框图;图2为双隐含层的LSTM时间序列点预测模型架构;图3为水质指标部分测试样本的区间预测结果。具体实施方式下面结合附图和具体实施例对本专利技术作进一步详细说明。基于深度学习算法与混合整数线性规划相结合的水质波动区间预测方法的整体流程框图如图1所示,具体包括以下步骤:步骤一、水质指标的历史数据预处理水质指标的预测属于时间序列预测问题,任何一个时间点的数据缺失都会在一定程度上影响整体预测的准确性,故有必要将水质监测历史数据补全。根据缺失点前后的已知数据,用最小二乘的方法构造拟合多项式,再根据这个多项式进行水质指标历史数据缺失值的补充。在深度学习的模型训练中,一般会进行输入数据的归一化处理,以消除样本幅值对模型训练的不利影响。采取如下的归一化处理办法,将输入数据映射到[0,1]区间:其中x是样本生数据,xmax和xmin分别为样本生数据的最大值和最小值,yp为x归一化处理后的数据。步骤二、LSTM时间序列点预测方法首先进行数据集划分。本实施例中以采用PH值、DO、CODMn和NH3-N四种水质指标为例,但不仅限于这四种水质指标。分别将PH值、DO、CODMn和NH3-N四种主要水质指标的历史时间序列数据,按60%、30%、10%划分为独立的训练集、验证集和测试集,如图1所示,其中测试集用于验证本专利技术方法的有效性。假设当前时刻t下,已知量为y1,…,yt,需要预测未来t+1,…,t+m共计m时刻的值yt+1,…,yt+m。假设未来m个时刻的水质指标与其最临近的d个时刻的已知水质指标密切相关,构造训练样本数据集Xtrain{yk-m-d+1,…,yk-m}→Ytrain{yk-m+1,…,yk},k=t,…,m+d,将样本数据集中的{yk-m-d+1,…,yk-m}作为输入,送入LSTM网络,{yk-m+1,…,yk}作为网络模型理想输出的参照值。故可以确定,LSTM网络的输入层节点数为d个,输出层节点数为m个。双隐含层的LSTM时间序列点预测模型架构如图2所示。本实施例中采用了近似生物神经激活函数Relu和随机丢弃机制Dropout。激活函数Relu模型曲线的变化特点:单侧抑制,相对宽阔的兴奋边界,稀疏激活性。很多研究使用非线性激活函数Relu代替常用的非线性激活函数,如Sigmoid,显示出遥遥领先的优势,主要表现在后者在训练深度结构模型时,容易趋于饱和态,降低训练速度,同时Relu还能生成非常稀疏的激活输出向量,因而能有效减少计算开销。Dropout是最近几年提出的防止模型过拟合的技术,其主要思想是在训练和预测时随机减少特征个数,即去掉输入数据中的某些维度,通过设置Dropout中的参数p,在训练和预测模型的时候,每次更新都会丢掉(总数*p)个特征。在图2中,被打叉的节点就是被丢弃的。Dropou本文档来自技高网...
基于深度学习算法与混合整数线性规划相结合的水质波动区间预测方法

【技术保护点】
一种基于深度学习算法与混合整数线性规划相结合的水质波动区间预测方法,其特征在于,包括以下步骤:(1)对水质历史数据进行预处理:修补缺失的历史数据,并进行归一化处理;将预处理后的数据分成相互独立的训练集和验证集;(2)利用步骤(1)中经过预处理后的训练集的水质数据时间序列,进行基于深度学习LSTM模型的点预测建模,得到点预测模型;(3)基于步骤(2)的点预测模型,利用步骤(1)中经过预处理后的验证集构造关于置信度c的基于混合整数线性规划的区间预测通用模型,通用模型的目标为最小化区间预测的平均相对区间宽度,目标函数如下:

【技术特征摘要】
1.一种基于深度学习算法与混合整数线性规划相结合的水质波动区间预测方法,其特征在于,包括以下步骤:(1)对水质历史数据进行预处理:修补缺失的历史数据,并进行归一化处理;将预处理后的数据分成相互独立的训练集和验证集;(2)利用步骤(1)中经过预处理后的训练集的水质数据时间序列,进行基于深度学习LSTM模型的点预测建模,得到点预测模型;(3)基于步骤(2)的点预测模型,利用步骤(1)中经过预处理后的验证集构造关于置信度c的基于混合整数线性规划的区间预测通用模型,通用模型的目标为最小化区间预测的平均相对区间宽度,目标函数如下:其中U(valid_pij)和L(valid_pij)为最优预测区间的上下边界,valid_pij为LSTM点预测值,valid_rij为真实值,N是验证集中的样本数量;约束条件如下:U(valid_pij)=valid_pij×αjL(valid_pij)=valid_pij×βj,L(valid_pij)=valid_rij+valid_rij×μi,1-valid_...

【专利技术属性】
技术研发人员:郑保宁包哲静
申请(专利权)人:郑保宁包哲静
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1