当前位置: 首页 > 专利查询>肖红军专利>正文

一种生化需氧量参数在线软测量方法技术

技术编号:12695276 阅读:85 留言:0更新日期:2016-01-13 13:42
本发明专利技术公开了一种生化需氧量参数在线软测量方法,样本数据归一化处理,利用主元分析解耦和降维;利用Jolliffe参数剔除和主体数据不相符的离群点,利用中值滤波器去除数据生成和采集过程中的噪声干扰;确定局部线性回归模型;权值初始化;模型输出预测,进行模型训练,利用代价函数通过梯度下降法来调整半正定距离矩阵D得到权值;将有效样本数据通过训练好的局部线性回归预测模型进行在线BOD参数软测量。本发明专利技术的有益效果是可以实现在线预测,而且只需检测一些容易测量的辅助变量,成本较低。

【技术实现步骤摘要】

本专利技术属于数据测量
,涉及。
技术介绍
B0D是指污水出水指标之生化需氧量,在污水处理过程中,生化需氧量(B0D)是评 价水质好坏和处理效果的关键参数之一。由于其涉及很多复杂的生化反应过程,因此长期 以来B0D的测量都存在着很多问题,具体表现在:国际通用的标准检测方法测量滞后性较 大,快速检测方法测量成本过高且测量不准确。 污水处理过程高度复杂,测量参数众多,现场测试的数据由于受测量仪表精度、可 靠性和现场测量环境等因素的影响,会带有各种各样的测量误差,若数据不经过进一步处 理,采集到的低精度或失效的数据会导致测量精度大幅度下降,甚至会直接导致污水处理 软测量模型的失效。同时,通常需要采集更多的参数数据信息以更好的反映污水处理过程 状态,但是过多的参数数据使得后续的模型非常复杂。因此,如何保证采集数据的有效性, 以及如何剔除冗余信息是B0D参数软测量首先要解决的关键技术问题。 目前市场上的B0D检测仪表采用的主要是测压差法和生物传感器法为原理制作 的。例如美国哈希BODTrakTMlI分析仪,德国LovibondB0D分析仪等,采用的是测压差法; 日本CKC公司的α1000型B0D测量仪采用的是生物传感器方法制作的。采用压差法的测 量仪器测量时间过长,需要5天,远远无法满足污水处理过程实时控制的需要;采用生物传 感器法的B0D测量仪器存在着仪器生物传感器制作困难,测量范围较窄,相关的膜材料容 易损坏从而导致仪器的使用寿命不足,使用成本过高,因而也无法广泛应用。
技术实现思路
本专利技术的目的在于提供,解决了现有的测量 方法时间长,成本高的问题。 本专利技术所采用的技术方案是按照以下步骤进行: 步骤1 :样本数据预处理,得到有效样本数据; (1)样本数据归一化处理,使得样本数据处于之间; (2)利用主元分析解耦和降维; (3)利用Jolliffe参数剔除和主体数据不相符的离群点,以提高数据的可靠性; (4)利用中值滤波器去除数据生成和采集过程中的噪声干扰; 步骤2 :局部线性回归预测模型的建立及其训练; (1)确定局部线性回归模型; ⑵权值初始化; (3)模型输出预测,给定一个新的数据输入点,计算K个线性输入模型并得到预测 值; (4)模型训练,利用代价函数通过梯度下降法来调整半正定距离矩阵D得到权值; (5)如果代价函数不满足要求,则调整矩阵D进而修改权值,回到第(3)步,直至代 价函数满足要求,则模型训练结束,权值确定; 步骤3 :B0D参数在线软测量输出;将有效样本数据通过训练好的局部线性回归预 测模型进行在线B0D参数软测量。 进一步,所述在线B0D参数软测量中,对实时检测到的辅助变量进行预处理,包括 如归一化、主元分析、判断是否为离群点、噪声滤波。 进一步,所述步骤2中,权值初始化,权值wjlj用高斯核得到:Wi=exp(_0·5 (X「xc)TD(x「xc)),W=diag{w!,…,wM} 其中D为半正定距离矩阵,它决定了数据点x。附近数据集的大小和形状; 模型输出预测,给定一个新的数据输入点,计算K个线性输入模型并得到预测值 &5总的输出则是根据权值进行线性平均: 模型训练,利用式(8)所示的代价函数通过梯度下降法来调整矩阵D从而学习得 到权值; 其中Μ是数据集合中数据点的个数,参数γ通过经验试凑的方式获得。 本专利技术的有益效果是可以实现在线预测,而且只需检测一些容易测量的辅助变 量,成本较低。【附图说明】 图1是数据预处理流程图; 图2是模型训练流程图; 图3是活性污泥污水处理流程; 图4是基于Jolliffe参数的测试数据的离群点检测; 图5是LWPR算法预测效果图。【具体实施方式】 下面结合【具体实施方式】对本专利技术进行详细说明。 步骤1 :样本数据预处理; 如图1所示,样本数据预处理的具体步骤为: (1)样本数据归一化处理,使得样本数据处于之间。 (2)利用主元分析(PCA)解耦和降维。例如给定一组Μ个已经中心化的观测值, 其标准方差为σ,同时每个变量Xk都是m维数据,x(k) = (xk(l); : : : ;xk(m))其中m <Μ。主元分析将变量xk映射成另外一个变量tk:tk=pTxk (1) 其中P是mXm的正交矩阵,它的第1列\是协方差矩阵c的第i个特征向量。 换句话说PCA必须先解决特征值问题: 入;\^=(^;,1 = 1,··.,!]! (2) 其中λ1是C的第i个特征值,vi则是与这个特征值相关的特征向量。基于v^口 Xk的正交变换可以得到主元tk,如以下公式所示: 经过PCA变换,前几个特征向量根据特征值降序的方式排列出来。以此获得比较 重要的特征值、特征向量和主元,而忽视无关紧要的变量。以此同时,原始数据间的耦合性 也得到了消除。 (3)利用Jolliffe参数剔除和主体数据不相符的离群点,以提高数据的可靠性。 其中tlk是第k个主元的第i个观测值,Μ变量的个数,即是属性个数,q代表了小 方差主元的个数(例如方差< 1),R代表大方差主元个数,σ是第k个主元的标准差,统计 量1和d2l主要用于检测偏离主体结构的数据,而d3l用于检测剧烈影响主体结构方差的数 据,设置4、d2l和d3l的阈值即可剔除离群点。 (4)利用中值滤波器去除数据生成和采集过程中的噪声干扰。 本专利技术对样本数据预处理目的是为了得到干净有效的数据,它是建立软测量输出 模型的一个必要环节,其主要作用有:①利用主元分析(PCA)解耦和降低样本数据以获得 重要的主元即后续模型的输入辅助变量,忽略无关精要的辅助变量,从而减少数据维数,减 小模型处理的复杂度;②剔除和主体数据不相符的离群点,以提高数据的可靠性,离群点主 要来源于仪表的故障或者维护,它的存在极易导致后续建模的偏离甚至失败;③滤波去除 数据生成和采集过程中的噪声干扰,噪声干扰主要由于仪表本身问题以及周围环境对仪表 和传感器的干扰和影响而产生的,它恶化了数据的质量,甚至淹没了目标特征,给后续分析 处理带来了困难。经过预处理后的数据可靠性得到了明显提升。 步骤2 :局部线性回归预测模型的建立及其训练; (1)局部线性回归(LWPR)模型的确定。LWPR算法考虑的仍然是标准的回归模型: y=f(x) +e (5) 其中,x表示d维的输入数据,y表示标准化的输出,同时e是〇均值随机噪声当前第1页1 2 本文档来自技高网...

【技术保护点】
一种生化需氧量参数在线软测量方法,其特征在于按照以下步骤进行:步骤1:样本数据预处理,得到有效样本数据;(1)样本数据归一化处理,使得样本数据处于[‑1,1]之间;(2)利用主元分析解耦和降维;(3)利用Jolliffe参数剔除和主体数据不相符的离群点,以提高数据的可靠性:(4)利用中值滤波器去除数据生成和采集过程中的噪声干扰;步骤2:局部线性回归预测模型的建立及其训练;(1)确定局部线性回归模型;(2)权值初始化:(3)模型输出预测,给定一个新的数据输入点,计算K个线性输入模型并得到预测值;(4)模型训练,利用代价函数通过梯度下降法来调整半正定距离矩阵D得到权值;(5)如果代价函数不满足要求,则调整矩阵D进而修改权值,回到第(3)步,直至代价函数满足要求,则模型训练结束,权值确定;步骤3:BOD参数在线软测量输出;将有效样本数据通过训练好的局部线性回归预测模型进行在线BOD参数软测量。

【技术特征摘要】

【专利技术属性】
技术研发人员:肖红军刘乙奇黄道平李先祥
申请(专利权)人:肖红军
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1