当前位置: 首页 > 专利查询>安徽大学专利>正文

一种近红外光谱特征提取方法及装置制造方法及图纸

技术编号:23047362 阅读:24 留言:0更新日期:2020-01-07 14:19
本发明专利技术公开了一种近红外光谱特征提取方法及装置,所述方法包括:获取N个待测样品;使用光谱仪获取N个待测样品的近红外光谱数据;对近红外光谱数据进行预处理获取二维近红外光谱平滑数据;对二维近红外光谱平滑数据经排列与转换获取四维谱图数据;对四维谱图数据进行特征提取;对特征提取后的四维谱图数据进行特征排列获取二维特征数据;本发明专利技术的优点在于:能够保证数据的完整性,能够在全光谱区间进行特征提取,保证信息不会丢失。

A method and device of near infrared spectrum feature extraction

【技术实现步骤摘要】
一种近红外光谱特征提取方法及装置
本专利技术涉及模式识别及无损检测领域,更具体涉及一种近红外光谱特征提取方法及装置。
技术介绍
近红外光谱分析技术是一种利用化学物质在近红外光谱区间的光学特性,实现对检测对象定性、定量快速检测的分析方法,具有样品用量少,样品无损伤,分析速度快,检测成本低,无废物污染等常规检测分析方法无法比拟的优点。经过多年的技术发展与完善,该技术已在农业、石油、医药、化工、食品等国家重要生产领域得到广泛应用。随着我国市场经济的不断发展及生活质量标准的提高,国际市场及广大消费者对于产品质量要求也不断提升,以化学检验为主的传统分析方法因其耗时、污染等缺点已无法满足市场需求和人民需要,而代替传统检测分析方法的近红外光谱分析方法则能够实现对样品的快速、无损检测。但是,确保样品完整性前提下所获取的数据一般都是高维数据,而现有分析方法具有如下缺点:(1)对于分析对象存在高度依赖性。现有特征提取算法根据分析对象和所获取数据的特点具有不同的作用效果,具体体现为所有分析方法不具有通用性,只能对具有一种或几种数据结构的分析对象起作用,当检测对象变化频率较高时,无法确保现有分析方法的有效性;(2)特征数据完整性较低。特征数据的完整性决定所建模型的有效性、稳定性和理解性,现有分析方法只能实现对近光谱数据区间选择或数据压缩,无法实现对全光谱区间的特征提取,因此无法保证最终建模数据的完整性,导致现有分析模型难优化。(3)特征提取结果存在局限性。现有特征提取算法均是基于在线性空间内寻找数据相关性,对于近光谱数据的非线性特征不进行能有效分析。当近光谱数据的样品数小于数据维度时,现有非线性核函数拓维方法反而会使超平面数据维度低于原始数据维度,从而导致信息丢失。中国专利公开号CN108446631A,公开了基于卷积神经网络的深度学习的智能频谱图分析方法,获取所需分析的频谱图像集;频谱图像预处理;训练卷积神经网络(CNN)模块;所需频谱图像输入到训练好的CNN中进行特征提取和性能分析;输出结果。该专利技术解决了处理频谱数据中数据维度过高或者不确定的而导致的模型结构不具备通用性的问题。但是其输入的是频谱图象,不能对二维数据样本进行分析,从而导致二维数据样本易丢失,无法实现对全光谱区间的特征提取,无法保证最终数据的完整性。
技术实现思路
本专利技术所要解决的技术问题在于如何提供一种数据完整性高,对全光谱区间进行特征提取的近红外光谱特征提取方法及装置。本专利技术通过以下技术手段实现解决上述技术问题的:一种近红外光谱特征提取方法,所述方法包括:获取N个待测样品;使用光谱仪获取N个待测样品的近红外光谱数据;对近红外光谱数据进行预处理获取二维近红外光谱平滑数据;对二维近红外光谱平滑数据经排列与转换获取四维谱图数据;对四维谱图数据进行特征提取;对特征提取后的四维谱图数据进行特征排列获取二维特征数据。通过将近红外光谱数据转换为四维谱图数据,将四维谱图数据作为输入变量进行特征提取,保证数据完整性,实现全光谱区间的非线性特征提取,解决现有分析方法特征信息丢失问题,增加样本的有效信息,提高系统的准确性。优选的,所述对近红外光谱数据进行预处理获取二维近红外光谱平滑数据,包括:构建当前待测样品的长度为2λ+1的局部模型根据局部模型,获取局部模型对应的吸收率模型其中,Xt为t时刻当前待测样品的中心点的波长,Yt为Xt对应的吸收率;将局部区间[t-λ,t+λ]缩放映射至区间[-1,1],获取局部区间的权值函数其中,x*为缩放映射至区间[-1,1]后的值,通过公式对Xt对应的吸收率进行平滑处理,获得Xt对应的吸收率的平滑数据重复以上步骤,对每个样品中M个波长对应的吸收率全部进行平滑处理,获得N×M的二维近红外光谱平滑数据优选的,所述对二维近红外光谱平滑数据经排列与转换获取四维谱图数据,包括:将N×M的二维近红外光谱平滑数据以M为轴,步长a截断,排列成b行,使得二维近红外光谱平滑数据转化为a×b×N的三维光谱数据通过映射关系f将三维光谱数据转换为四维谱图数据其中,为转换后的四维谱图数据,r为光谱数据步长区间,r'为RGB步长区间,Dic为RGB字典,其中,R为像素分辨率,Ψ1=[0r'2r'…127]T,Ψ2=[128128+r'128+2r'…255]T。优选的,所述对四维谱图数据进行特征提取,包括:以四维谱图数据作为卷积神经网络的输入层,经过L个卷积层与池化层,按照“卷积——池化——卷积——池化……”的顺序进行运算,获得谱图特征,完成四维谱图数据的特征提取,其中,每个卷积层Ci包含个维度为的自编码卷积核,卷积层的输入数据经卷积运算后作为池化层的特征数据,池化层Pi包含一个维度为的池化窗口。优选的,所述对特征提取后的四维谱图数据进行特征排列获取二维特征数据,包括:通过反变换的方式将谱图特征进行特征排列,获得二维特征数据。一种近红外光谱特征提取装置,所述装置包括:筛选模块,用于获取N个待测样品;光谱数据获取模块,用于使用光谱仪获取N个待测样品的近红外光谱数据;平滑处理模块,用于对近红外光谱数据进行预处理获取二维近红外光谱平滑数据;四维谱图数据获取模块,用于对二维近红外光谱平滑数据经排列与转换获取四维谱图数据;特征提取模块,用于对四维谱图数据进行特征提取;特征排列模块,用于对特征提取后的四维谱图数据进行特征排列获取二维特征数据。优选的,所述平滑处理模块,还用于:构建当前待测样品的长度为2λ+1的局部模型根据局部模型,获取局部模型对应的吸收率模型其中,Xt为t时刻当前待测样品的中心点的波长,Yt为Xt对应的吸收率;将局部区间[t-λ,t+λ]缩放映射至区间[-1,1],获取局部区间的权值函数其中,x*为缩放映射至区间[-1,1]后的值,通过公式对Xt对应的吸收率进行平滑处理,获得Xt对应的吸收率的平滑数据重复以上步骤,对每个样品中M个波长对应的吸收率全部进行平滑处理,获得N×M的二维近红外光谱平滑数据优选的,所述四维谱图数据获取模块,还用于:将N×M的二维近红外光谱平滑数据以M为轴,步长a截断,排列成b行,使得二维近红外光谱平滑数据转化为a×b×N的三维光谱数据通过映射关系f将三维光谱数据转换为四维谱图数据其中,为转换后的四维谱图数据,r为光谱数据步长区间,r'为RGB步长区间,Dic为RGB字典,其中,R为像素分辨率,Ψ1=[0r'2r'…127]T,Ψ2=[128128+r'128+2r'…255]T。优选的,所述特征提取模块,还用于:以四维谱图数据作为卷积神经网络的输入层,经过L个卷积层与池化层,按照“卷积——池化——卷积——池化……”的顺序进行运算,获得谱图特征,完成四维谱图数据的特征提本文档来自技高网
...

【技术保护点】
1.一种近红外光谱特征提取方法,其特征在于,所述方法包括:/n获取N个待测样品;/n使用光谱仪获取N个待测样品的近红外光谱数据;/n对近红外光谱数据进行预处理获取二维近红外光谱平滑数据;/n对二维近红外光谱平滑数据经排列与转换获取四维谱图数据;/n对四维谱图数据进行特征提取;/n对特征提取后的四维谱图数据进行特征排列获取二维特征数据。/n

【技术特征摘要】
1.一种近红外光谱特征提取方法,其特征在于,所述方法包括:
获取N个待测样品;
使用光谱仪获取N个待测样品的近红外光谱数据;
对近红外光谱数据进行预处理获取二维近红外光谱平滑数据;
对二维近红外光谱平滑数据经排列与转换获取四维谱图数据;
对四维谱图数据进行特征提取;
对特征提取后的四维谱图数据进行特征排列获取二维特征数据。


2.根据权利要求1所述的一种近红外光谱特征提取方法,其特征在于,所述对近红外光谱数据进行预处理获取二维近红外光谱平滑数据,包括:构建当前待测样品的长度为2λ+1的局部模型



根据局部模型,获取局部模型对应的吸收率模型



其中,Xt为t时刻当前待测样品的中心点的波长,Yt为Xt对应的吸收率;
将局部区间[t-λ,t+λ]缩放映射至区间[-1,1],获取局部区间的权值函数



其中,x*为缩放映射至区间[-1,1]后的值,
通过公式对Xt对应的吸收率进行平滑处理,获得Xt对应的吸收率的平滑数据
重复以上步骤,对每个样品中M个波长对应的吸收率全部进行平滑处理,获得N×M的二维近红外光谱平滑数据


3.根据权利要求2所述的一种近红外光谱特征提取方法,其特征在于,所述对二维近红外光谱平滑数据经排列与转换获取四维谱图数据,包括:将N×M的二维近红外光谱平滑数据以M为轴,步长a截断,排列成b行,使得二维近红外光谱平滑数据转化为a×b×N的三维光谱数据通过映射关系f将三维光谱数据转换为四维谱图数据



其中,为转换后的四维谱图数据,r为光谱数据步长区间,r'为RGB步长区间,Dic为RGB字典,
其中,R为像素分辨率,Ψ1=[0r'2r'…127]T,Ψ2=[128128+r'128+2r'…255]T。


4.根据权利要求3所述的一种近红外光谱特征提取方法,其特征在于,所述对四维谱图数据进行特征提取,包括:以四维谱图数据作为卷积神经网络的输入层,经过L个卷积层与池化层,按照“卷积——池化——卷积——池化……”的顺序进行运算,获得谱图特征,完成四维谱图数据的特征提取,其中,每个卷积层Ci包含个维度为的自编码卷积核,卷积层的输入数据经卷积运算后作为池化层的特征数据,池化层Pi包含一个维度为的池化窗口。


5.根据权利要求4所述的一种近红外光谱特征提取方法,其特征在于,所述对特征提取后的四维谱图数据进行特征排列获取二维特征数据,包括:通过反变换的方式将谱图特征进行特征排列,获得二维特征数据。
<...

【专利技术属性】
技术研发人员:潘天红郭威李鱼强陈山皱小波
申请(专利权)人:安徽大学江苏大学
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1