基于BP网络的HDP分子蒸馏系统的最优控制方法技术方案

技术编号:15637886 阅读:244 留言:0更新日期:2017-06-15 10:32
基于BP网络的HDP分子蒸馏系统的最优控制方法涉及分子蒸馏最优控制技术领域,该方法充分利用了非线性拟合能力较强的神经网络和动态规划算法,通过将两种方法相结合,使各自的优点充分发挥,能在很大的程度上克服传统方法的缺陷,完成网络的训练、检验和最优评价,为生产过程的决策和控制提供可靠的依据。本发明专利技术方法具体是利用BP神经网络算法建立分子蒸馏系统的模型网络、评价网络以及执行网络,模型网络能够准确预测出系统的下一个状态,评价网络能够对控制效果进行评价,执行网络能够根据上一个状态给出此时的最优控制量,使得影响馏出物产品质量的关键因素得到合理有效的控制,从而保证产品的纯度和得率在规定范围内。

【技术实现步骤摘要】
基于BP网络的HDP分子蒸馏系统的最优控制方法
本专利技术涉及分子蒸馏最优控制
,具体涉及一种基于BP网络的启发式动态规划(HeuristicDynamicProgrammingHDP)分子蒸馏系统的最优控制方法。
技术介绍
分子蒸馏技术,又称短程蒸馏技术,具有操作温度低、蒸馏压强低、受热时间短等特点,适用于高沸点、热敏、高粘度物质的提取、分离和精制,在诸如精细化工、药品、香精、食用添加剂、石化实际工程领域的应用中,具有常规蒸馏技术无法比拟的优势。然而由于分子蒸馏系统参数多、耦合、非线性、滞后性等特点,传统控制技术无法满足现在工业生产高效、节能要求,限制了分子蒸馏的最大产能。为了进一步提高分子蒸馏生产过程的自动化水平、稳定性以及最大产能,需要探求新的控制方式。在现有的分子蒸馏设备上,刮膜电机转速、蒸发温度以及压力的控制多是采用工业上最常用的PID控制技术,相应的多个控制量的控制必然是通过解耦之后,用多路PID完成控制的。但在分子蒸馏系统中,参数之间的耦合非常严重,在解耦过程中,必然会忽略很多因素,导致各个参数的运行实际值也不符合他们的设定值,最终使得整个系统控制精确度变差,在分子蒸馏系统中表现为参数之间的匹配不合理,最终导致被分离物的纯度和得率不理想。自适应动态规划由人工智能和控制领域交汇发展形成的,以传统的最优控制为理论基础,融合人工智能的先进方法,为大规模复杂非线性系统优化控制问题的解决提供了方案。自适应动态规划的基本思想是利用函数近似结构,逼近动态规划中的性能指标函数和控制策略,以满足最优性原理从而获得最优控制和最优性能指标函数。启发式动态规划(HDP)是自适应动态规划的一种,也是应用最普遍的一种,在分子蒸馏中,该方法的使用避免了分子蒸馏的建模及解耦问题,它能够直接给出分子蒸馏系统所需的最优控制量。
技术实现思路
为了解决传统方法确定的分子蒸馏工艺参数不准确,馏出物的纯度和得率低的问题,本专利技术提供基于BP网络的HDP分子蒸馏系统的最优控制方法,实现分子蒸馏的工艺参数的最优化,为系统提供最优的控制量u。本专利技术的方法首先要建立起模型网络、评价网络、执行网络、定义效用函数,如下:模型网络采用具有n+m个输入层神经元、km个隐含层神经元和n个输出层神经元的结构,n+m个输入分别为系统k时刻的状态向量x(k)的n个分量以及执行网络对状态向量x(k)的控制向量u(k)的m个分量,n个输出则是对系统在k+1时刻的状态向量x(k+1)的预测向量的n个分量;模型网络的隐含层采用双极性sigmoidal函数,输出层采用线性函数purelin,模型网络结构如图2所示。评价网络采用具有n个输入层神经元、kj个隐含层神经元和1个输出层神经元的结构,n个输入是系统k时刻的状态向量x(k)的n个分量,输出是与输入状态对应的最优性能指标的估计;评价网络的隐含层采用双极性sigmoidal函数,输出层采用线性函数purelin,评价网络的结构如图3所示。执行网络采用具有n个输入层神经元、ku个隐含层神经元和m个输出层神经元的结构,n个输入是系统在k时刻的状态向量x(k)的n个分量,m个输出则是与输入状态向量x(k)对应的控制向量u(k)的m个分量;执行网络的隐藏层采用双极性sigmoidal函数,输出层采用线性函数purelin,执行网络结构如图4所示。效用函数定义为U(k)=xT(k)Ax(k)+uT(k)Bu(k),其中A、B为正定矩阵,x(k)为状态向量,u(k)为控制向量。在分子蒸馏系统中,蒸发面温度、蒸发器内真空度、进料速度、一级刮膜电机转速、二级刮膜电机转速是影响被分离物得率和纯度的主要因素,并且这几个量都是可测的,所以选择蒸发面温度、蒸发器内真空度、进料速度、一级刮膜电机转速和二级刮膜电机转速作为控制向量u(k),得率和纯度作为分子蒸馏系统的状态向量x(k)。本专利技术基于BP网络的HDP分子蒸馏系统的最优控制方法,具体包括以下步骤:步骤一:采用梯度下降法训练模型网络:如图1所示,模型网络的输入包括分子蒸馏系统在k时刻的控制向量u(k)、状态向量x(k),输出为k+1时刻的状态向量x(k+1),模型网络的结构为7—14—2即输入层包含7个节点、隐层包含14个节点、输出层包含2个节点;步骤1.1、随机初始化模型网络的权值wm1,wm2(wm1为输入层到隐层的权值,wm2为隐层到输出层之间的权值),设置训练次数c,允许误差ε,学习效率lm;步骤1.2、以多组真实实验数据建立实验样本库,即,将分子蒸馏系统在k时刻的控制向量u(k)、状态向量x(k)作为模型网络的输入向量M(k)=[u(k)x(k)]T,将k+1时刻的状态向量x(k+1)作为模型网络的输出向量为x(k+1),建立具有映射对应关系的多组实验数据组作为实验样本;从实验样本库中选择N个样本训练模型网络;步骤1.3、模型网络的正向计算:步骤1.4、计算误差式中,x(k+1)是模型网络k+1时刻的期望输出,是模型网络的预测输出;模型网络的权值按下面的式子进行更新:步骤1.5、判断误差(式中,x(k+1)是模型网络k+1时刻的期望输出,是模型网络的预测输出)是否小于ε,若误差大于ε且训练次数小于c,则转到步骤1.6;若误差小于ε或训练次数大于等于c则转步骤1.8;步骤1.6、更新权值wm1和wm2,如下:①wm2更新:wm2(k+1)=wm2(k)+Δwm2(k)(6)②wm1更新:wm1(k+1)=wm1(k)+Δwm1(k)(8)步骤1.7、返回步骤1.3;步骤1.8、模型网络训练完成;步骤二:定义效用函数U(k)=U[x(k),u(k),k]:对于分子蒸馏系统,效用函数定义为U(k)=xT(k)Ax(k)+uT(k)Bu(k),其中A为5阶单位阵、B为2阶单位阵;步骤三:确定执行网络与评价网络的结构并初始化神经网络:执行网络的结构为2—8—5,输入层到隐含层的权值为wa1,隐含层到输出层的权值为wa2,学习效率为la;评价网络的结构为2—5—1,输入层到隐含层的权值为wc1,隐含层到输出层的权值为wc2,学习效率为lc,允许误差为εc,设定训练次数为nc,已训练次数为c(初始值c=0);步骤四:从已有的实验数据中,选择N组数据作为训练样本,并设定分子蒸馏系统的初始状态x(k);步骤五:将x(k)作为执行网络(如图4所示)的输入,产生控制向量u(k),得到u(k)的计算过程如下:步骤六:求解效用函数U(k)的值:U(k)=xT(k)Ax(k)+uT(k)Bu(k)步骤七:将x(k)输入到评价网络,得到k时刻的计算过程如下:步骤八:将当前阶段的状态x(k)与执行网络输出的控制向量u(k)作为输入向量M(k)输入到模型网络(如图2所示)得到k+1时刻状态向量x(k+1),得到x(k+1)的计算过程如下:步骤九:将状态x(k+1)输入到评价网络获得的计算过程如下:步骤十:计算评价网络误差Ec(k),并判断Ec(k)与εc的大小;如果Ec(k)大于εc,则转步骤十一,如果Ec(k)<=εc则转步骤十二;误差Ec(k)的计算如下式所示:其中,步骤十一:更新评价网络的权值wc1和wc2,评价网络的训练也采用梯度下降法,权值更新过程如下:步骤11.1、wc2的更新本文档来自技高网
...
基于BP网络的HDP分子蒸馏系统的最优控制方法

【技术保护点】
基于BP网络的HDP分子蒸馏系统的最优控制方法,其特征在于,该方法包括如下步骤:步骤一:采用梯度下降法训练模型网络:模型网络的输入包括分子蒸馏系统在k时刻的控制向量u(k)、状态向量x(k),输出为k+1时刻的状态向量x(k+1),模型网络的结构为输入层包含7个节点、隐含层包含14个节点、输出层包含2个节点;具体方法如下:步骤1.1、随机初始化模型网络的权值w

【技术特征摘要】
1.基于BP网络的HDP分子蒸馏系统的最优控制方法,其特征在于,该方法包括如下步骤:步骤一:采用梯度下降法训练模型网络:模型网络的输入包括分子蒸馏系统在k时刻的控制向量u(k)、状态向量x(k),输出为k+1时刻的状态向量x(k+1),模型网络的结构为输入层包含7个节点、隐含层包含14个节点、输出层包含2个节点;具体方法如下:步骤1.1、随机初始化模型网络的权值wm1,wm2,其中,wm1为输入层到隐含层的权值,wm2为隐含层到输出层的权值,设置训练次数c,允许误差ε,学习效率lm;步骤1.2、以多组真实实验数据建立实验样本库,即,将分子蒸馏系统在k时刻的控制向量u(k)、状态向量x(k)作为模型网络的输入向量M(k)=[u(k)x(k)]T,将k+1时刻的状态向量x(k+1)作为模型网络的输出向量为x(k+1),建立具有映射对应关系的多组实验数据组作为实验样本;从实验样本库中选择N个样本训练模型网络;步骤1.3、模型网络的正向计算,如下:步骤1.4、计算误差式中,x(k+1)是模型网络k+1时刻的期望输出,是模型网络的预测输出;步骤1.5、判断误差是否小于ε,若误差大于ε且训练次数小于c,则转到步骤1.6;若误差小于ε或训练次数大于等于c,则转到步骤1.8;步骤1.6、更新权值wm1和wm2,如下:①wm2更新:②wm1更新:wm1(k+1)=wm1(k)+Δwm1(k)(8)步骤1.7、返回步骤1.3;步骤1.8、模型网络训练完成;步骤二:定义效用函数U(k)=U[x(k),u(k),k],对于分子蒸馏系统,效用函数定义为U(k)=xT(k)Ax(k)+uT(k)Bu(k),其中A为5阶单位阵、B为2阶单位阵;步骤三:确定执行网络与评价网络的结构并初始化神经网络:执行网络的结构为输入层包含2个节点、隐含层包含8个节点、输出层包含5个节点,输入层到隐含层的权值为wa1,隐含层到输出层的权值为wa2,学习效率为la;评价网络的结构为输入层包含2个节点、隐含层包含5个节点、输出层包含1个节点,输入层到隐含层的权值为wc1,隐含层到输出层的权值为wc2,学习效率为lc,允许误差为εc,设定训练次数为nc,已训练次数为c(初始值c=0);步骤四:从已有的实验数据中,选择N组数据作为训练样本,并设定分子蒸馏系统的初始状态x(k);步骤五:将x(k)作为执行网络的输入,产生控制向量u(k),得到u(k)的计算过程如下:步骤六:求解效用函数U(k)的值:U(k)=xT(k)Ax(k)+uT(k)Bu(k)步骤七:将x(k)输入到评价网络,得到k时刻的计算过程如下:步骤八:将当前阶段的状态x(k)与执行网络输出的控制向量...

【专利技术属性】
技术研发人员:李慧孙文杰李颖
申请(专利权)人:长春工业大学
类型:发明
国别省市:吉林,22

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1