一种基于卷积神经网络的近红外光谱波长选择方法技术

技术编号:30968078 阅读:18 留言:0更新日期:2021-11-25 20:42
本发明专利技术提供一种基于卷积神经网络的近红外光谱波长选择方法,包括以下步骤,S1搭建CNN卷积神经网络;S2采用检测目标近红外光谱标样训练CNN模型,更新CNN卷积神经网络超参数;S3模拟正向传播过程,获取波长点权重大小。本发明专利技术优选波长后的模型性能明显由于全波长的情况,与iPLS相比,特征波长数更少,性能相当,略有优势。由于本专利为波长点选择算法,当阈值间隔粒度取值更小时,可以获得更高精度的特征波长选择结果。波长选择结果。波长选择结果。

【技术实现步骤摘要】
一种基于卷积神经网络的近红外光谱波长选择方法


[0001]本专利技术属于化学工程领域,具体涉及一种基于卷积神经网络的近红外光谱波长选择方法。

技术介绍

[0002]偏最小二乘法(PLS)被认为具有很强的抗干扰能力,是近红外光谱建模中最常用的多元校准方法。在PLS中,主成分满足保留原始光谱信息和最佳解释主导变量的要求。但是,PLS是通过将原始特征空间映射到新空间来构建模型的,无法剔除不相关和冗余的变量。对光谱数据进行处理或变换,可以减少甚至消除各种非目标因素对光谱的影响,尽可能去除不相关的信息变量,能进一步提高校正模型预测能力和稳定性。该法是隐变量建模技术,不利于对待测物质进行谱学解释。
[0003]iPLS以及优化算法是主流特征波长提取算法,其原理是将全谱分为若干等宽的区间,通过比较RMSECV和RMSEP选择合适的波长或波长区间进行建模。当检测目标为复杂物质的综合表征时,检测目标近红外光谱数据信息严重耦合,导致待测指标的模式不明(如:检测废液COD含量时,近红外光谱对水分子有强吸收,对待测含量不敏感),采用波段选择方法选取波段组合,很可能会丢失与待测组分相关的光谱信息;使用上述线性建模方法或传统前馈神经网络形成的浅层学习模型,表征和识别检测目标光谱与待测指标的复杂关系时往往也“力不从心”,模型的预测能力及泛化性能几乎达到瓶颈。基于上述方法选取特征波长的代表性将受到严重影响。

技术实现思路

[0004]本专利技术要解决的技术问题是,针对待测指标的模式不明复杂测量体系,现有隐变量建模技术和波段选择技术,不利特征波长选择和对待测物质进行谱学解释。
[0005]本专利技术提供一种基于卷积神经网络的近红外光谱波长选择方法,包括以下步骤,
[0006]S1搭建CNN卷积神经网络;
[0007]S2采用检测目标近红外光谱标样训练CNN模型,更新CNN卷积神经网络超参数;
[0008]超参数包括,1.卷积核数量:knum,2.卷积核大小:ksize,3.隐藏层神经元数量:q,在步骤S2中多次调试超参数值,直到网络模型预测效果达到最佳。
[0009]S3模拟正向传播过程,计算所有卷积核对每个波长点的全路径传播过程所得的系数,系数为正时判定该波长点吸光度对于预测值有正向贡献,对应波长点的权重加1,得到每个波长点的权重大小;
[0010]进一步的,
[0011]所述步骤S2包括,
[0012]S21)初始化超参数;
[0013]S22)随机初始化向量k
k
,F,H;
[0014]S23)输入光谱矩阵和对应待测成分浓度值向量;
[0015]S24)卷积运算,求卷积层、全连接层各单元输出;
[0016]S25)求目标值和浓度值的偏差E;
[0017]S26)求误差梯度,更新权值和偏置;
[0018]S27)重复步骤S23)

S26),直到E小于设定阈值;
[0019]S28)得到卷积核权重k
k
=(k
k1
,k
k2
,

,k
ksize
),下标k=1,2,

,knum,knum表示卷积核数量,size表示卷积核大小,k
k
表示第k个卷积核的权重向量;
[0020]Flatten层与隐藏层之间权重由矩阵F表示,隐藏层与输出层的权重由向量H表示,H=(h1…
h
q
),p为flatten层单元数量,q为隐藏层神经元数量。f表示Flatten层与隐藏层两个神经元之间的连接权重,h表示隐藏层与输出层之间神经元的连接权重。
[0021]进一步的,
[0022]所述步骤S3包括,
[0023]初始化第i个卷积核对应的波长点权重向量:w
i
=(0,0,0,

,0),w
i
是n维向量,i=1,2,

,knum;
[0024]执行第一循环,第一循环定义变量k的初始值为1,每执行一次第一循环,k的值增加1,直到k的值为knum时结束第一循环;
[0025]第一循环的内容包括,执行第二循环,第二循环定义变量i的初始值为1,每执行一次第二循环i的值增加1,直到i的值为n时结束第二循环;
[0026]第二循环的内容包括,定义变量temp的值为1,执行第三循环,第三循环定义变量j的初始值为i,每执行一次第三循环j的值增加1,直到j的值为i+size时结束第三循环;
[0027]第三循环的内容包括:
[0028]定义变量temp的值为1;
[0029]若w
k
(j)+k
k
(temp)*F(a,b)*H(b)的值大于0,则w
k
(i)的值为1,否则w
k
(i)的值为0,其中a=(1,2,

,p),b=(1,2,

,q);
[0030]变量temp的值增加1。
[0031]本专利技术的有益效果是,优选波长后的模型性能明显优于全波长的情况,与iPLS相比,特征波长数更少,结构更精简,性能相当。由于本专利技术为波长点选择算法,当阈值间隔粒度取值更小时,可以获得更高精度的特征波长选择结果。
附图说明
[0032]图1样本光谱图。
[0033]图2卷积神经网络示意图。
[0034]图3各波长点正向贡献次数示意图。
[0035]图4三种方法选择的特征波长范围粗略比较示意图。
[0036]图5本专利技术流程图。
具体实施方式
[0037]本专利技术的专利技术构思是,采用非线性深度神经网络在近红外光谱全谱区训练检测模型,形成重要特征参数,然后将这些特征返回到光谱的相应区域来寻找特征波长点。
[0038]卷积神经网络是多层感知器的变体,它是前馈卷积运算和人工神经网络(ANN)的组合模式(深度特征提取+非线性函数逼近),可将输入数据映射到一组适当的输出上,被广泛应用于包含复杂信息的图像识别与检测,对于图片的深度特征提取、分类具有独特的优势。由此可见,卷积运算即是特征提取过程,训练后的CNN卷积层的每个输出节点对应一个应用于频谱特定区域的核。因此,可以将特征选择算法应用到这种输出中去寻找重要的特征;然后将这些特征返回到光谱的相应区域。
[0039]本专利技术主要步骤包括,S1.搭建CNN卷积神经网络(基于一维卷积核);S2.采用检测目标近红外光谱标样训练CNN模型;S3.模拟正向传播过程,计算所有卷积核对每个波长点的全路径传播过程(卷积层+全连接层)所得的系数,系数为正时表示该波长点吸光度对于预测值有正向贡献,对应波长点的权重加1,得到每个波长点的总权重,波长点权重大小(对预测值贡献)体现该波长点对待测物质解释能力。
[0040]本专利采用卷积神经网络搭建检测目本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于卷积神经网络的近红外光谱波长选择方法,包括以下步骤,S1搭建CNN卷积神经网络;S2采用检测目标近红外光谱标样训练CNN模型,更新CNN卷积神经网络超参数;S3模拟正向传播过程,计算所有卷积核对每个波长点的全路径传播过程所得的系数,系数为正时判定该波长点吸光度对于预测值有正向贡献,对应波长点的权重加1,得到每个波长点的权重大小。2.如权利要求1所述的一种基于卷积神经网络的近红外光谱波长选择方法,其特征在于,所述步骤S2包括,S21)初始化超参数;S22)随机初始化向量k
k
,F,H;S23)输入光谱矩阵和对应待测成分浓度值向量;S24)卷积运算,求卷积层、全连接层各单元输出;S25)求目标值和浓度值的偏差E;S26)求误差梯度,更新权值和偏置;S27)重复步骤S23)

S26),直到E小于设定阈值;S28)得到卷积核权重k
k
=(k
k1
,k
k2
,

,k
ksize
),下标k=1,2,

,knum,knum表示卷积核数量,size表示卷积核大小,k
k
表示第k个卷积核的权重向量;Flatten层与隐藏层之间权重由矩阵F表示,隐藏层与输出层的权重由向量H表示,H=(h1ꢀ…ꢀ
h
q
),p...

【专利技术属性】
技术研发人员:梅青平胡媛莉董引娣丁允超翁代云汪忆何娇
申请(专利权)人:重庆城市管理职业学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1