当前位置: 首页 > 专利查询>吉林大学专利>正文

基于模糊划分和模型集成的气体传感器阵列浓度检测方法技术

技术编号:13709488 阅读:69 留言:0更新日期:2016-09-15 19:24
一种基于模糊划分和模型集成的气体传感器阵列浓度检测方法,属于气体传感器阵列信号处理技术领域,该方法借助模糊聚类方法对基线漂移数据进行时间段划分,将原始数据集划分成漂移程度不同的多个子数据集;然后建立不同训练数据集的回归模型,得到若干子回归模型;在训练集内获得每个子回归模型的最优权重集合,对聚类中心和最优权重进行拟和,得到最优权重拟和函数;在测试阶段,基于最优权重拟和函数和聚类中心时间计算拟和权重,将这些子回归模型对待测数据的预测结果进行集成,得到最终气体浓度值。此方法能自适应地改变模式识别模型,使其能跟踪漂移的变化,有效减小漂移对浓度检测性能的影响,保证浓度测量的长期准确性。

【技术实现步骤摘要】

本专利技术属于气体传感器阵列信号处理
,具体涉及一种基于模糊划分和模糊加权多输出支持向量回归模型集成的长期漂移补偿的金属氧化物气体传感器阵列浓度检测方法。
技术介绍
利用气体传感器装置代替传统的分析仪器是混合气体检测的新方法,金属氧化物半导体(Metal Oxide Semiconductor,MOS)气体传感器与其他类型气体传感器(如电化学式传感器、声表面波传感器、导电聚合物传感器等)相比具有体积小、成本低、响应恢复快、使用寿命长等优点。随着微电子机械系统加工技术的进步,可以在Si衬底上实现阵列化,采用这种工艺的微结构气体传感器功耗低、与半导体制造工艺兼容性好、便于集成。因此,基于MOS气体传感器阵列的检测方法能够满足轻量化、快速、低成本的要求,易于实现多点、实时测量。基于多个敏感特性不同的传感器优化组合构成传感器阵列,并结合先进的智能化识别技术,可以形成高精度的气体辨识系统。然而,由于气敏元件存在本身固有的局限性,其中最大缺陷之一就是存在特性漂移,使得基于MOS气体传感器的检测方法的测量精度、稳定性和可靠性受到限制。通过改进敏感材料、器件结构和补偿电路的方法能在一定程度上改善漂移问题,但使器件结构复杂化,提高了器件的成本,更主要的是仍不能从根本上解决并达到理想的结果。目前,分类器集成的漂移补偿方法受到广泛关注,该方法的思想是利用不同数据集合训练分类器,得到若干分类器模型,再将这些子分类器对待测数据的识别结果进行集成,得到最终结果。然而,目前方法仍存在问题,一是数据集的时间段划分采用数据量均匀分布的划分方法,没有考虑漂移变化的程度;二是目前的分类器的集成方法,仅用于定性分析气体种类,而不能用于混合气体浓度的识别;三是采用的支持向量机方法中,没有考虑各个样本点在模式识别过程中的重要程度的不同,预测精度有待提高。
技术实现思路
针对现有技术中存在的上述问题,本专利技术的目的在于提供一种基于模糊划分和模型集成的气体传感器阵列漂移补偿方法,用于单一或混合气体的浓度检测。该方法通过聚类方法按照基线信号的漂移程度进行时间段划分,提高模型对传感器漂移变化影响的鲁棒性;采用加权多输出支持向量回归,考虑各个样本点在回归过程中的重要程度的不同,从而提高气体浓度测量的长期准确性和稳定性。为实现上述目的,本专利技术采用了如下的技术方案:一种基于模糊划分和模型集成的气体传感器阵列浓度检测方法,具体步骤如下:步骤1:数据采集:采用样气流量系统(Sample Flow System,SFS)测量方法,采集电子鼻检测系统中金属氧化物半导体气体传感器阵列的时间响应信号,提取在标准气体环境下的基线响应数据和不同浓度的单一或混合气体下响应信号的特征数据;基线响应数据X0(t)包含K个时间响应序列,X0(t)=[x01(t),x02(t),…,x0K(t)],K为气体传感器的个数,x0i(t)=[x0i(t1),x0i(t2),…,x0i(tN)]T,t1,t2,…,tN为采样时刻,N为样本个数,i表示第i个传感器,i∈[1,2,…,K],[·]T表示向量的转置;传感器阵列在不同浓度的单一或混合气体下响应信号的特征数据为x(t)=[x1(t),x2(t),…,xK(t)],其中xi(t)=[xi1(t),xi2(t),…,xiM(t)],M为每个传感器输出响应提取的特征数;步骤2:数据预处理:对步骤1采集的基线响应数据进行预处理,包括异常值剔除和标准化两个步骤:异常值剔除的方法是首先计算样本均值和样本的标准偏差分别如下: X ‾ 0 [ x ‾ 01 , x ‾ 02 , ... , x ‾ 0 K ] = 1 N [ Σ i = 1 N x 01 ( t i ) , Σ i = 1 N x 02 ( t i ) , ... , Σ i = 1 N x 0 K ( t i ) ] , ]]> S 0 = [ S 01 , S 02 , ... , S 0 K ] = [ ( 1 N - 1 Σ i = 1 N ( x 01 ( t 本文档来自技高网
...

【技术保护点】
基于模糊划分和模型集成的气体传感器阵列漂移补偿方法,其步骤如下:步骤1:数据采集:采用样气流量系统测量方法,采集电子鼻检测系统中金属氧化物半导体气体传感器阵列的时间响应信号,提取在标准气体环境下的基线响应数据X0(t)和不同浓度的单一或混合气体下响应信号的特征数据x(t)=[x1(t),x2(t),…,xK(t)],其中,K为气体传感器的个数;步骤2:数据预处理:对步骤1采集的基线响应数据进行预处理,包括异常值剔除和标准化两个步骤:异常值剔除的方法是首先计算样本均值和样本的标准偏差分别如下:然后判断基线响应数据与样本均值之差是否大于标准偏差的3倍,即若大于,则剔除该基线数据样本,并使用样本平均值填充此数据,若小于,则保留;采用阿特曼方法标准化后的数据为其中步骤3:在预处理后的基线响应数据中加入对应的时间向量t=[t1,t2,…,tN]T,得到增广的基线矩阵数据令则ti时刻的基线数据可表示为步骤4:采用聚类方法对步骤3得到的增广的基线矩阵数据进行分析,具体步骤如下:步骤①:随机选取C个元素,作为C个类的中心,初始化隶属函数矩阵,给定聚类中心改变量的阈值uε;步骤②:确定目标函数;目标函数定义为N为样本的个数,uij为第i个数据点属于第j类的隶属度;βj是第j类的中心;z为隶属度的加权指数,1≤z<∞;d(x0(ti),βj)为相似度度量方式;步骤③:确定相似度度量方式:设计相似度度量方式为式中ω=[ω1,ω2,…,ωK]是与输入属性相对应的权重向量,ωk∈[0,1],其值可通过实验进行选择,ω0表示时间输入属性的向量权重,取值为1;步骤④:最小化目标函数,重新计算C个类各自的中心和隶属度函数;模糊分组的迭代过程中隶属度函数与聚类中心的更新分别为步骤⑤:重复步骤④,直到聚类结果不再变化或相对上次得到的聚类中心和隶属度函数的改变量小于预先确定的阈值,得到最终确定的聚类中心βi和隶属度函数uij;步骤⑥:由于增广的基线矩阵数据X0(t)的第一列元素为响应时间,因此相对应地取每个聚类中心向量βi的第一个元素按照从小到大排列构成(T1,T2,…,TC),作为每个时间段划分的聚类中心时刻,体现了在每个时间段内传感器漂移随时间变化的程度是不同的,然后计算与聚类中心时刻相对应的扩展宽度则与聚类中心时刻对应的时间段范围为[Tj‑η·δj,Tj‑η·δj],η为区间的重叠参数,调整η可以控制时间段的重叠程度;步骤⑦:根据聚类方法得到的时间段范围[Tj‑η·δj,Tj‑η·δj],将基线响应数据划分为C个不同时段的数据集D1,D2,…,DC,每个数据集的样本数为步骤5:选取D1,D2,…,DL作为训练集,L<C,DL+1,DL+2,…,DC作为测试集;在每个训练数据集内,采用加权多输出支持向量回归(WM‑SVR)方法得到回归函数在每个训练集内,设这个训练集的样本数为NDm,加权多输出支持向量回归方法为,对回归函数目标是寻找W=[w1,w2,…,wQ],b=[b1,b2,…,bQ]T,求解优化问题:步骤6:在每个训练集内按步骤5计算得到的回归函数设为j=1,2,…,L,把这些回归函数加权组合得到模型集成的回归预测模型:然后确定每个训练集的权重系数方法为:对每个权重系数在[0,1]区间内进行搜索,搜索间隔为0.02,计算样本浓度实际值yi与预测值ymodel,i之间的均方根误差对权重系数在其搜索范围内的每一种情况得到的均方根误差RMSE最小的那一组为最优权重系数;步骤7:构建权重的拟和函数gj(t),j=[1,2,…,L],用以确定以下测试集的回归预测模型的权重系数:本步骤方法具体为:采用步骤6中得到的最优权重系数αi作为机器学习过程的结果,最优权重系数αi对应的各训练集的中心时刻Ti作为数据,即此学习过程的训练样本为基于最小二乘支持向量回归的方法得到权重的拟和函数gj(t);最小二乘支持向量回归方法中选取径向基核函数作为核函数;核参数δ、惩罚因子、不敏感参数寻优算法采用基于粒子群智能全局优化算法的参数选择方法;步骤8:测试阶段:根据步骤7得到的权重拟和函数gj(t)计算拟和权重g1(Ti),g2(Ti),…,gL(Ti);然后基于各子回归模型与拟和权重进行回归模型的集成得到每个测试集内单一或混合气体的浓度预测最终值。...

【技术特征摘要】
1.基于模糊划分和模型集成的气体传感器阵列漂移补偿方法,其步骤如下:步骤1:数据采集:采用样气流量系统测量方法,采集电子鼻检测系统中金属氧化物半导体气体传感器阵列的时间响应信号,提取在标准气体环境下的基线响应数据X0(t)和不同浓度的单一或混合气体下响应信号的特征数据x(t)=[x1(t),x2(t),…,xK(t)],其中,K为气体传感器的个数;步骤2:数据预处理:对步骤1采集的基线响应数据进行预处理,包括异常值剔除和标准化两个步骤:异常值剔除的方法是首先计算样本均值和样本的标准偏差分别如下:然后判断基线响应数据与样本均值之差是否大于标准偏差的3倍,即 若大于,则剔除该基线数据样本,并使用样本平均值填充此数据,若小于,则保留;采用阿特曼方法标准化后的数据为其中 步骤3:在预处理后的基线响应数据中加入对应的时间向量t=[t1,t2,…,tN]T,得到增广的基线矩阵数据令则ti时刻的基线数据可表示为步骤4:采用聚类方法对步骤3得到的增广的基线矩阵数据进行分析,具体步骤如下:步骤①:随机选取C个元素,作为C个类的中心,初始化隶属函数矩阵,给定聚类中心改变量的阈值uε;步骤②:确定目标函数;目标函数定义为N为样本的个数,uij为第i个数据点属于第j类的隶属度;βj是第j类的中心;z为隶属度的加权指数,1≤z<∞;d(x0(ti),βj)为相似度度量方式;步骤③:确定相似度度量方式:设计相似度度量方式为 式中ω=[ω1,ω2,…,ωK]是与输入属性相对应的权重向量,ωk∈[0,1],其值可通过实验进行选择,ω0表示时间输入属性的向量权重,取值为1;步骤④:最小化目标函数,重新计算C个类各自的中心和隶属度函数;模糊分组的迭代过程中隶属度函数与聚类中心的更新分别为步骤⑤:重复步骤④,直到聚类结果不再变化或相对上次得到的聚类中心和隶属度函数的改变量小于预先确定的阈值,得到最终确定的聚类中心βi和隶属度函数uij;步骤⑥:由于增广的基线矩阵数据X0(t)的第一列元素为响应时间,因此相对应地取每个聚类中心向量βi的第一个元素按照从小到大排列构成(T1,T2,…,TC),作为每个时间段划分的聚类中心时刻,体现了在每个时间段内传感器漂移随时间变化的程度是不同的,然后计算与聚类中心时刻相对应的扩展宽度则与聚类中心时刻对应的时间段范围为[Tj-η·δj,Tj-η·δj],η为区间的重叠参数,调整η可以控制时间段的重叠程度;步骤⑦:根据聚类方法得到的时间段范围[Tj-η·δj,Tj-η·δj],将基线响应数据划分为C个不同时段的数据集D1,D2,…,DC,每个数据集的样本数为 步骤5:选取D1,D2,…,DL作为训练集,L<C,DL+1,DL+2,…,DC作为测试集;在每个训练数据集内,采用加权多输出支持向量回归(WM-SVR)方法得到回归函数在每个训练集内,设这个训练集的样本数为NDm,加权多输出支持向量回归方法为,对回归函数目标是寻找W=[w1,w2,…,wQ],b=[b1,b2,…,bQ]T,求解优化问题:步骤6:在每个训练集内按步骤5计算得到的回归函数设为j=1,2,…,L,把这些回归函数加权组合得到模...

【专利技术属性】
技术研发人员:王庆凤卢革宇孙鹏
申请(专利权)人:吉林大学
类型:发明
国别省市:吉林;22

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1