一种基于多核支持向量机的发酵过程动态预测方法技术

技术编号:9738744 阅读:192 留言:0更新日期:2014-03-06 17:54
一种基于多核支持向量机的发酵过程动态预测方法,既属于生物发酵领域,又属于信息科学领域,具体涉及在发酵过程中应用改进的支持向量机建立发酵过程模型预测生物状态参数的方法。具体步骤包括:从历史批次数据库中搜索与当前时间窗内数据最相似的数据,组成相似训练样本集,利用建立的相似训练样本集,运用支持向量机算法,建立当前批次当前时刻的局部训练模型。同时,构造多核函数来处理不同阶段的样本建立局部模型。本发明专利技术实现了发酵过程生物状态参数的及时准确的测量,省去了对发酵过程分阶段然后进行建模的麻烦,具有样本需求量小,预测准确且时间短的优点,对实现发酵过程的控制和优化控制有重要意义。

【技术实现步骤摘要】

本专利技术既属于生物发酵领域,又属于信息科学领域,具体涉及在发酵过程中应用改进的支持向量机建立发酵过程模型预测生物化学参数的方法。
技术介绍
发酵工程,是指采用现代工程技术手段,利用微生物的某些特定功能,为人类生产有用的产品,或直接把微生物应用于工业生产过程的一种新技术,是生物技术的重要组成部分,是生物技术产业化的重要环节。现代发酵技术日益成为全球经济的重要组成部分。国家发改委、工信部发布的《食品工业十二五发展规划》预期,到2015年,发酵工业总产值达4600亿元以上,年均增长率达15%以上。生物技术、药物在《医药工业“十二五”发展规划》中也被确定为发展的重点领域。而据有关资料统计,在有些发达国家中,发酵工业的产值已经占国民生产总值的5%。在医药产品中,发酵产品占有特别重要的地位,其产值占医药工业总产值的20%,通过发酵生产的抗生素就达200多个品种。可见,发酵工业在与人们生活密切相关的医药、食品、化工、冶金、资源、能源、健康、环境等领域中,都有着难以估量的社会和经济效益。随着发酵行业工业化进程的迅速推进与发展,对发酵过程进行控制和动态优化的要求也越来越迫切,而控制与优化的基础则是要首先解决发酵过程有关参数的在线检测问题。而发酵过程是一个复杂过程,具有时变、非线性、不确定、多变量耦合等特性,人类尚未完全弄清楚它的机理。一般的发酵过程需要测量的状态参数可分为物理参数、化学参数和生物参数。目前,物理参数一般可以通过传感器在线获得,而绝大部分化学参数和生物参数的测量则成了难以解决的问题。针对生物化学参数的测量问题,沿袭传统的检测技术发展思路,主要是通过研制新型的在线分析仪表,以硬件形式实现过程参数的在线测量。但是在线分析仪表不仅价格昂贵,而且维护保养复杂,并且现有的在线生物传感器的测量精度难以保证,生物参数值主要通过离线分析得到,这往往存在较大的滞后,无法及时反馈控制信息。所以对于生物参数的控制,目前基本上都是凭借人类的实践经验进行手动控制,但是由于大多数的微生物发酵过程都比较复杂,单纯地依靠人们的实践经验会带来生产效率低和生产成本高的问题,无法达到提高生产率的需求。由此可见,针对发酵过程,首先要解决的问题就是建立一个发酵过程模型,通过所建立的模型可以估计一些不能在线测量的生物化学参数,如菌体浓度、产物浓度和基质浓度。然后既可以通过所建立的发酵模型对生物化学参数进行实时控制,也可以实现发酵过程的优化控制。优化控制是指基于数学模型通过优化算法寻优得到适合大批量生产的最优发酵工艺,并对生产过程进行控制,能够促进发酵过程的研发工作和产业化生产,最终可以提高产物的产量。然而由于发酵过程各批次数据间的差异性和不确定性,现在发酵过程中大多建模方式是离线和预先建模,不可避免地存在生产条件一旦改变,原有模型可能无法适应新环境的情况。而且在对发酵产物的稳定性与一致性要求越来越高的今天,基于模型的控制方法大量运用,而影响控制效果的一个重要方面就是模型的精确程度,所以研究建立精确的发酵过程的动态模型预测生物化学参数对实现发酵过程的控制和优化控制有重要意义。
技术实现思路
本专利技术针对上述现有技术中存在的问题,提出了一种基于多核支持向量机建立发酵过程动态模型的方法来实现生物化学参数的准确预测。而发酵过程模型的动态性通过建立发酵过程动态样本集的方法来实现,克服了发酵过程各批次之间差异巨大造成的生产条件一旦改变,原有模型无法适应新环境的问题;同时,通过构造多核函数来适应发酵过程多阶段特点,省去了对发酵过程分阶段建模的麻烦。本专利技术采用了如下的技术方案和实现步骤:步骤(1):定义发酵过程样本点表示形式:将发酵过程中在线可测量的参数和在线不可测量的待预测的参数组合成发酵过程的样本,具体的样本点表示形式如下:T = (x1; X2,..., xn;y)①其中,X1, X2, , Xn表示发酵过程中在线可测量的η个参数,y表示发酵过程中在线不可测量的待预测的参数;步骤(2):构造历史批次数据库:离线测试,得到同一发酵过程相同工艺下的R+1批次数据,选择其中的任一批次数据作为当前批次数据,其余的R批次数据作为历史批次数据,其中第r批次k时刻历史数据表示如下:T: (k) = (X;, (k),Xr2 (k),...,xljk): Vr (/c+ 1)) = (X'r{k):yr (k +1))②其中,r= 1,2,...,!?,R为历史批次总数;k= 1,2,…,N,N为每一批次的样本点总数;对历史数据进行归一化处理,归一化公式如下所示:本文档来自技高网
...

【技术保护点】
一种基于多核支持向量机的发酵过程动态预测方法,其特征在于包含以下步骤:步骤(1):定义发酵过程样本点表示形式:将发酵过程中在线可测量的参数和在线不可测量的待预测的参数组合成发酵过程的样本,具体的样本点表示形式如下:T=(x1,x2,...,xn;y)??①其中,x1,x2,...,xn表示发酵过程中在线可测量的n个参数,y表示发酵过程中在线不可测量的待预测的参数;步骤(2):构造历史批次数据库:离线测试,得到同一发酵过程相同工艺下的R+1批次数据,选择其中的任一批次数据作为当前批次数据,其余的R批次数据作为历史批次数据,其中第r批次k时刻历史数据表示如下:Tr*(k)=(xr1*(k),xr2*(k),...,xrn*(k);yr(k+1))=(Xr*(k);yr(k+1))②其中,r=1,2,…,R,R为历史批次总数;k=1,2,…,N,N为每一批次的样本点总数;对历史数据进行归一化处理,归一化公式如下所示:X‾=1N×RΣr=1RΣk=1NXr*(k)③σ=1N×R-1Σr=1RΣk=1N(Xr*(k)-X‾)2④Xr(k)=Xr*(k)-X‾σ⑤其中,r=1,2,…,R,R为历史批次总数;k=1,2,…,N,N为每一批次的样本点总数;表示第r历史批次k时刻的原始样本值,Xr(k) 表示第r历史批次k时刻原始样本值归一化后的样本值;步骤(3):建立当前批次当前采样时刻发酵过程相似训练样本集,具体步骤为:步骤(3.1):根据上面的归一化公式对当前批次数据进行归一化。步骤(3.2):构建当前批次当前采样时刻的时间窗查询序列,具体的,当前批次k时刻时间窗长为l的查询序列构建方法如下:当1≤k≤l时,查询序列为:Xs={X(1),X(2),…X(l)};当(l+1)≤k≤N时,查询序列为:Xs={X(k?l+1),X(k?l+2),…X(k)};步骤(3.3):建立当前批次当前采样时刻对应的相似训练样本集,具体的,构建当前批次k时刻对应的相似训练样本集的方法为,以动态时间归整DTW为相似性指标,对于R个历史批次数据,从每个历史批次数据中找出一个与当前批次k时刻的查询序列时间窗长l相同、DTW值最小的数据区间,组成样本点个数为l×R的相似训练样本集A(k)={M1(k),M2(k),…,MR(k)},其中Mi(k)表示第i个历史批次数据中与当前批次k时刻的查询序列时间窗长l相同、DTW值最小的数据区间;步骤(4):构造当前批次当前采样时刻对应的多核函数:在计算机上使用MATLAB软件中的支持向量机(SVM)工具箱,对核函数类型进行修改,构造出适用于发酵过程多阶段特点的多核函数,其形 式如下:K(x,x′)=a1KRBF(x,x′)+a2KPoly(x,x′)??⑥其中KRBF(x,x′)代表RBF核函数,且核参数σ∈[1,10];KPoly(x,x′)代表Poly核函数,且核参数d∈[1,6]、d为整数;ai,i=1,2代表核函数的权重系数,且满足条件ai≥0,a1+a2=1;权重系数ai及核参数初始值随机确定,并根据预测均方根误差进行调整;步骤(5):支持向量机训练,完成当前批次当前时刻预测模型的建立,具体为:利用步骤(3)中建立的当前批次k采样时刻对应的相似训练样本集和步骤(4)中所构造的多核函数,使用MATLAB中的支持向量机(SVM)工具箱进行训练,从而完成当前批次当前时刻模型的建立;步骤(6):利用步骤(5)建立的当前批次当前时刻的预测模型,完成当前批次下一时刻输出变量y(k+1)的预测,具体为:将当前批次k时刻输入向量X(k)输入到建立的支持向量机模型中,完成当前批次k+1时刻输出变量y(k+1)的预测;步骤(7):返回步骤(3),滚动建立下一时刻的预测模型,不断输出生物化学参数预测值,直到遍历当前批次所有采样时刻。FDA0000419010400000015.jpg...

【技术特征摘要】
1.一种基于多核支持向量机的发酵过程动态预测方法,其特征在于包含以下步骤: 步骤(1):定义发酵过程样本点表示...

【专利技术属性】
技术研发人员:高学金耿凌霄王普李亚芬
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1