基于径向基函数神经网络的气体标志物检测方法及应用技术

技术编号:23498474 阅读:38 留言:0更新日期:2020-03-13 13:20
本发明专利技术提供一种径向基函数神经网络的呼出气体标志物检测方法及应用,涉及气敏传感检测领域,首先使用气敏传感器对人体呼出气体标志物进行检测与标定,构建多维传感器阵列对模拟患病状态时呼出气体进行测试,获取大量样本数据,其次利用主成分分析‑粒子群优化‑径向基函数神经网络算法模型对样本数据进行预处理,降低变量维度,减少气敏传感器交叉敏感性,最终对人体呼出气体浓度进行精确预测,可靠性好,通用性强。最后将获得的样本数据与对应的疾病状态建立关系,构筑人体疾病诊断数据库模型系统,对呼出气相关疾病预测提供指导。

Gas marker detection method and application based on radial basis function neural network

【技术实现步骤摘要】
基于径向基函数神经网络的气体标志物检测方法及应用
本专利技术涉及气敏传感检测
,尤其涉及一种基于径向基函数神经网络的呼出气体标志物检测方法及其在疾病诊断应用中的模型系统。
技术介绍
随着社会的发展和生活水平提高,民生健康成为关注重点。在人体代谢过程会产生各种气体,比如挥发性有机气体、一氧化氮、硫化氢等气体。这些气体会通过体内血液循环进入呼吸系统,进而排出体外。如果呼出的某种或者几种标志物气体取样后,检查样本发现浓度超出一定范围,就意味着人体的新陈代谢机制发生了变化,存在着罹患疾病的可能。由人体疾病与呼出气体关系可知,人体患病类型与其呼出气体组分类型与呼出气体的浓度有一定的相关性。模式识别技术是对感知信号进行分析处理后,对其中的物体、形象、行为等特征进行准确描述、辨识、分类的过程。模式识别技术在气敏传感器阵列检测中具有十分重要的作用,基于气敏传感器阵列数据进行模式识别,能够最终实现对多组分呼出气体浓度定性、定量识别。然而,现有传感器采集获得的直接响应值往往与拟采集呼出气体浓度之间的数学关系往往不够直观,数据量大、关系复杂。同时,人体呼出气体种类复杂、保存困难易污染、传感器响应之间交叉敏感性严重,导致拟合效果差,可靠性与通用性降低。因此需要对中间参数数据进行处理,以便于获得早期筛查系统能够使用的中间结果数据。
技术实现思路
为了克服上述现有技术中存在的问题,提供了一种基于径向基函数神经网络的呼出气体标志物检测方法及其在疾病诊断应用中的模型系统。首先使用气敏传感器构建多维传感器阵列对模拟患病状态时呼出气体标志物进行检测与标定,获取大量样本数据;然后利用模式识别技术结合智能算法模型对样本数据进行预处理,降低变量维度,减少气敏传感器交叉敏感性,最终对人体呼出气体浓度进行精确预测,用于构筑人体疾病诊断模型系统。本专利技术提供如下技术方案:基于径向基函数神经网络的气体标志物检测方法,首先,使用气敏传感器对人体呼出气体标志物进行检测与标定,构建多维传感器阵列对模拟患病状态时呼出气体进行测试,获取若干样本数据;然后,利用主成分分析-粒子群优化-径向基函数神经网络(PCA-PSO-RBF)算法模型对样本数据进行预处理,降低变量维度,减少气敏传感器交叉敏感性;最终,对人体呼出气体浓度进行预测。优选的,在PCA-PSO-RBF算法模型中,通过主成分分析模型对呼出气体样本数据进行主成分分析,根据各个变量的贡献率提取主要成分;将主要成分变量作为粒子群算法优化的RBF神经网络模型的输入对新的样本数据进行学习训练,并基于该优化模型实现对人体呼出气体浓度参数的预测,样本数据预处理步骤具体包括:(1)对原始样本数据进行标准化处理,通过PCA算法降维后分组为训练样本与测试样本数据;具体的,PCA算法将原来具有一定相关性的变量按照标准化组合成新的无关变量,其降维的基本思想为通过将原始样本数据进行线性组合,生成新的互不相关的指标信息,从中筛选出少数新的指标,使新的指标包含大部分原始数据信息,进而实现少数指标对原始数据信息的解释;(2)构建包括输入层、隐含层和输出层的三层径向基函数神经网络,RBF神经网络关系如式(1)所示:式中i=1,2,…k,Wi为输出权重;ci为隐层基函数中心;δi为隐层基函数宽度;x为输入数据;为RBF神经网络输出;k为输入数据样本数;e为自然常数;初始化粒子群及RBF神经网络,选取输出权重Wi、隐层基函数中心ci、隐层基函数宽度δi作为优化参数进行粒子群算法优化;种群中每个粒子的初始适应度值为样本数据的局部极值,全部种群中粒子的最小适应度值为样本数据的全局极值;(3)计算各粒子的适应度值,使用神经网络的均方误差作为PSO优化算法的适应函数,适应度函数定义如式(2)所示:FitnessFunci为种群中第i个粒子的适应度值;D(xi1,xi2,xi3,...,xid)为核函数参数的平均误差平方和;(4)对种群中每个粒子,将每个粒子的适应度值与每个粒子所经历最好位置的适应度值进行比较,如果更好,更新局部极值Pbest;(5)对种群中每个粒子,将每个粒子的适应度值与群体中所经历最好位置的适应度值进行比较,如果更好,更新全局极值Gbest;(6)根据公式(3)和(4)更新粒子的速度和位置:vij(t+1)=wvij(t)+c1r1(pij(t)-xij(t))+c2r2(pgj(t)-xij(t)),(3)xij(t+1)=xij(t)+vij(t+1);(4)式中i=1,2,3,…,n;j=1,2,3,…,d;t为当前PSO算法迭代次数,w为PSO算法惯性权值,c1,c2为学习因子;r1,r2的取值范围为[0,1]之间均匀分布的随机数;Pi=(pi1,pi2,pi3,...,pid)为种群粒子i当前搜索的最优位置,Pg=(pg1,pg2,pg3,...,pgd)为整个种群当前搜索的最优位置;vij表示种群粒子i在第j维的速度,为了防止陷入局部最优,vij取值范围为[-vmax,vmax];wvij为种群粒子当前的活动状态;c1r1(pij(t)-xij(t))为种群粒子对过去的经验进行学习,使得种群中粒子个体逐渐移动到最优的位置;c2r2(pgj(t)-xij(t))表示为种群粒子对粒子群搜索经验的学习,进而使得种群中粒子个体移动到种群的最优位置;(7)当迭代次数或者适应度值满足设定的要求时,跳出循环,否则重复上述步骤(4)-(6)继续进行迭代寻优;(8)将得到的RBF神经网络最优参数代入到PCA-PSO-RBF网络模型中,选用测试样本进行预测。在实际检测的处理过程中,多个变量之间可能存在一定的相关性,比如本领域多种呼出气气敏传感器之间存在一定的交叉敏感性,同时当变量的维数比较高、变量之间存在复杂的关系时,加之杂质气体影响,进一步增加了数据分析难度,单纯靠RBF粒子群寻优难于高效获得所需结果。进一步,在步骤(1)中,设有n个样本,每个样本有p个变量,组成n×p维矩阵,如式(5)所示:通过将原始数据X转换为k个主成分,其中k个主成分是原始变量xi的线性组合,则新变量F1,F2,…Fk为原始变量的前k个主成分,因此新变量的数学表达为式(6):优选的,PCA算法降维步骤包括:①为了消除数据量纲和数量级的影响,将原始样本数据进行标准化处理,转化成无量纲的形式:式中,xij′为标准化的数据值;为原始数据平均值;σj为原始数据标准差;②计算相关系数矩阵:式中,rij(i,j=1,2,…,p)为原始变量数据xi和xj的相关系数,rij=rji计算公式如式(9)所示:③计算特征值与特征向量:根据特征方程|λI-R|=0的解,求出特征值λi,其中I为单位向量,R为相关系数矩阵;将特征值λi按照从大到小的顺序进行排列,分别求出在特征值λi下的特征向量uij(i=1,2,…,k;j=1本文档来自技高网...

【技术保护点】
1.基于径向基函数神经网络的气体标志物检测方法,其特征在于,首先,使用气敏传感器对人体呼出气体标志物进行检测与标定,构建多维传感器阵列对模拟患病状态时呼出气体进行测试,获取若干样本数据;然后,利用主成分分析-粒子群优化-径向基函数神经网络算法模型对样本数据进行预处理,降低变量维度,减少气敏传感器交叉敏感性;最终,对人体呼出气体浓度进行预测。/n

【技术特征摘要】
1.基于径向基函数神经网络的气体标志物检测方法,其特征在于,首先,使用气敏传感器对人体呼出气体标志物进行检测与标定,构建多维传感器阵列对模拟患病状态时呼出气体进行测试,获取若干样本数据;然后,利用主成分分析-粒子群优化-径向基函数神经网络算法模型对样本数据进行预处理,降低变量维度,减少气敏传感器交叉敏感性;最终,对人体呼出气体浓度进行预测。


2.根据权利要求1所述的气体标志物检测方法,其特征在于,在主成分分析-粒子群优化-径向基函数神经网络算法模型中,通过主成分分析模型对呼出气体样本数据进行主成分分析,根据各个变量的贡献率提取主要成分;将主要成分变量作为粒子群算法优化的径向基函数神经网络模型的输入对新的样本数据进行学习训练,并基于该优化模型实现对人体呼出气体浓度参数的预测,样本数据预处理步骤具体包括:
(1)对原始样本数据进行标准化处理,通过主成分分析算法降维后分组为训练样本与测试样本数据;
具体的,主成分分析算法将原来具有一定相关性的变量按照标准化组合成新的无关变量,其降维的基本思想为通过将原始样本数据进行线性组合,生成新的互不相关的指标信息,从中筛选出少数新的指标,使新的指标包含大部分原始数据信息,进而实现少数指标对原始数据信息的解释;
(2)构建包括输入层、隐含层和输出层的三层径向基函数神经网络,径向基函数神经网络关系如式(1)所示:



式中i=1,2,…k,Wi为输出权重;ci为隐层基函数中心;δi为隐层基函数宽度;x为输入数据;为径向基函数神经网络输出;k为输入数据样本数;e为自然常数;
初始化粒子群及径向基函数神经网络,选取输出权重Wi、隐层基函数中心ci、隐层基函数宽度δi作为优化参数进行粒子群算法优化;种群中每个粒子的初始适应度值为样本数据的局部极值,全部种群中粒子的最小适应度值为样本数据的全局极值;
(3)计算各粒子的适应度值,使用神经网络的均方误差作为粒子群优化优化算法的适应函数,适应度函数定义如式(2)所示:



FitnessFunci为种群中第i个粒子的适应度值;D(xi1,xi2,xi3,...,xid)为核函数参数的平均误差平方和;
(4)对种群中每个粒子,将每个粒子的适应度值与每个粒子所经历最好位置的适应度值进行比较,如果更好,更新局部极值Pbest;
(5)对种群中每个粒子,将每个粒子的适应度值与群体中所经历最好位置的适应度值进行比较,如果更好,更新全局极值Gbest;
(6)根据公式(3)和(4)更新粒子的速度和位置:
vij(t+1)=wvij(t)+c1r1(pij(t)-xij(t))+c2r2(pgj(t)-xij(t),)(3)
xij(t+1)=xij(t)+vij(t+1);(4)
式中i=1,2,3,…,n;j=1,2,3,…,d;t为当前粒子群优化算法迭代次数,w为粒子群优化算法惯性权值,c1,c2为学习因子;r1,r2的取值范围为[0,1]之间均匀分布的随机数;Pi=(pi1,pi2,pi3,...,pid)为种群粒子i当前搜索的最优位置,Pg=(pg1,pg2,pg3,...,pgd)为整个种群当前搜索的最优位置;vij表示种群粒子i在第j维的速度,为了防止陷入局部最优,vij取值范围为[-vmax,vmax];wvij为种群粒子当前的活动状态;c1r1(pij(t)-xij(t))为种群粒子对过去的经验进行学习,使得种群中粒子个体逐渐移动到最优的位置;c2r2(pgj(t)-xij(t))表示为种群粒子对粒子群搜索经验的学习,进而使得种群中粒子个体移动到种群的最优位置;
(7)当迭代次数或者适应度值满足设定的要求时,跳出循环,否则重复上述步骤(4)-(6)继续进行迭代寻优;
(8)将得到的径向基函数神经网络最优参数代入到主成分分析-粒子群优化-径向基函数网络模型中,选用测试样本进行预测。


3.根据权利要求2所述的气体标志物检测方法,其特征在于:在步骤(1)中,设有n个样本,每个样本有p个变量,组成n×p维矩阵,如式(5)所示:



通过将原始数据X转换为k个主成分,其中k个主成分是原始变量xi的线性组合,则新变量F1,F2,…Fk为原始变量的前k个主成分,因此新变量的数学表达为式(6):





4.根据权利要求3所述的气体标志物检测方法,其特征在于:主成分分析算法降维步骤包括:
①为了消除数据量纲和数量级的影响,将原始样本数据进行标准化处理,转化成无量纲的形式:



式中,xij′为标准化的数据值;为原始数据平均值;σj为原始数据标准差;
②计算相关系数矩阵:



式中,rij(I,j=1,2,…,p)为原始变量数据xi和xj的相关系数,rij=rji计算公式如式(9)所示:



③计算特征值与特征向量:
根据特征方程|λI-R|=0的解,求出特征值λi,其中I为单位向量,R为相关系数矩阵;将特征值λi按照从大到小的顺序进行排列,分别求出在特征值λi下的特征向量uij(i=1,2,…,k;j=1,2,…,p);
④选择p个主成分:
分别计算在特征值λi下的贡献率与累计贡献率,当计算出的累积贡献率达到90%以上且特征根大于1时,此时特征根对应的第1、第2…第m个主成分,选择前p个主成分可以代替原来的变量,从而实现对原始数据的降维;
⑤计算主成分表达式:
将计算出的uij与标准化的xij′相乘得到的表达式即为所需要的主成分表达式。


5.根据权利要求4所述的气体标志物检测方法,其特征在于:在粒子群优化算法的寻优过程中,假设在D维样本空间中存在n个粒子,并且每一个粒子均由位置Xi=(xi1,xi2,...,x...

【专利技术属性】
技术研发人员:张冬至薛庆忠吴振岭王兴伟张勇
申请(专利权)人:中国石油大学华东
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1