当前位置: 首页 > 专利查询>燕山大学专利>正文

一种一维光谱分类方法及系统技术方案

技术编号:29837018 阅读:18 留言:0更新日期:2021-08-27 14:26
本发明专利技术涉及一种一维光谱分类方法及系统,方法包括:获取m个待测样品的近红外光谱原始数据;截取所述近红外光谱原始数据中所有单一光谱序列的峰值数据并进行预处理,然后进行缩放,得到一维度光谱信号数据;将缩放后的一维度光谱信号数据进行极坐标编码;对极坐标编码后的一维度光谱信号数据进行重构,得到格拉姆角和场矩阵和格拉姆角差场矩阵;将格拉姆角和场矩阵和所述格拉姆角差场矩阵存储为图像;对图像进行划分,得到训练集和测试集;采用训练集对卷积神经网络进行训练;将测试集输入至训练好的卷积神经网络中,得到分类结果。本发明专利技术中的上述方法可以通过一维光谱与二维图像之间的双映射关系弥补丢失有用特征信息的不足。

【技术实现步骤摘要】
一种一维光谱分类方法及系统
本专利技术涉及一维光谱数据处理领域,特别是涉及一种一维光谱分类方法及系统。
技术介绍
近红外光谱技术是一种充分利用被测物质中含氢基团X-H(如O-H、C-H和N-H)在近红外光谱区间振动的倍频和合频的特征吸收,从而实现对被测物质的检测。该技术所适用的样品范围广,样品用量少,无损伤且易于操作。由于采集的是单一维度的吸收光谱信号,具有分析速度快,检测成本低等优点。经过人们多年的深入钻研以及检测技术的不断完善,近红外光谱已经综合运用了数学统计学、化学计量学和机器学习等多个学科,在医学、食品与农业、环境污染、石油与化工等领域得到实际的应用,所构建的分类识别模型的性能也在不断地提升。目前常用的一维光谱序列分类方法有最近邻、逻辑回归、朴素贝叶斯、决策树、支持向量机、神经网络等。这些机器学习方法在理论上能实现一维光谱序列的分类任务,但由于近红外光谱存在光谱范围广,数据维数高,有用信息强度弱,噪声干扰多等缺陷,这些传统的方法必须结合大量的光谱预处理,特征波长提取,维数约减等前期处理,既在无形中增加了任务量,又不可避免地错失有用的特征信息,无法确保分类结果的准确性以及模型的可应用性。目前,随着深度学习的快速发展,研究者们开始着重研究深度神经网络结构的设计。深度卷积神经网络(ConvolutionNeuralNetwork,CNN)作为深度学习的代表,在语音识别、计算机视觉以及自然语言处理等领域表现出优异的性能。在一维光谱领域,已有构建适合的一维度CNN的相关研究,但所建立的模型复杂且精度较低,鲁棒性较差。而要将CNN识别二维图像的优势应用于一维度的近红外光谱序列的分类,还需要解决以下问题:一是将一维光谱序列数据通过数学变换转换为能够突出其光谱特征的二维图像;二是要设计合适的卷积神经网络结构,以实现对这种特殊光谱图像的自动分类。
技术实现思路
本专利技术的目的是提供一种一维光谱分类方法及系统,可以通过一维光谱与二维图像之间的双映射关系弥补丢失有用特征信息的不足。为实现上述目的,本专利技术提供了如下方案:一种一维光谱分类方法,所述分类方法包括:获取m个待测样品的近红外光谱原始数据,记为X={x1,x2,…,xi,…,xn},n为总的波长点数,xi为标量;具体的,所采集的近红外光谱数据包含两个类别,分别为汽油和柴油数据。汽油对应类别0,柴油对应类别1,各有60组,即样本总数m=120。汽油光谱采样范围为900nm~1700nm,采样间隔为2nm。柴油光谱采样范围为750nm~1550nm,采样间隔为2nm,即波长点数n=401。该数据样本矩阵记为X(120×401),输出类别矩阵为Y(120×1)。为了后续二维CNN建模,将类别标签转换成独热编码的形式。截取所述近红外光谱原始数据中所有单一光谱序列的峰值数据;所截取的峰值数据长度为t,所截取的数据记为Xi={x1,…,xi,…,xt},t为当前的波长点数。对所述峰值数据进行预处理;对所述预处理后的峰值数据进行缩放,得到一维度光谱信号数据Xf;将所述缩放后的一维度光谱信号数据进行极坐标编码;对所述极坐标编码后的一维度光谱信号数据进行重构,得到格拉姆角和场矩阵和格拉姆角差场矩阵;将所述格拉姆角和场矩阵和所述格拉姆角差场矩阵存储为图像;对所述图像进行划分,得到训练集和测试集;采用所述训练集对卷积神经网络进行训练;将所述测试集输入至训练好的卷积神经网络中,得到分类结果。可选的,在对所述图像进行划分,得到训练集和测试集之后还包括:对所述训练集进行数据增强处理,包括旋转、放缩、平移、翻转、剪切变换和通道移位。可选的,对所述预处理后的峰值数据进行缩放具体包括:将所述预处理后的峰值数据缩放至[0,1]内,公式如下:其中,为波长为i对应的归一化后的有效光谱吸光度值,xi为波长为i对应的原始光谱吸光度值,Xi为峰值波长范围内的光谱吸光度序列。可选的,将所述缩放后的一维度光谱信号数据进行极坐标编码具体采用如下公式:其中,为波长为i对应的归一化后的有效光谱吸光度值,r为半径,i={1,2,……,t},t为当前的波长点数,Xf为峰值波长范围内经过缩放后的局部一维度光谱吸光度序列。由公式可知,转换后的角度φ的取值范围是[0,π],其余弦值在该范围内单调递减,随着波长的不断增大,每个笛卡尔坐标系统中的xi在这种映射关系下只对应极坐标系统中的唯一的值,在极坐标圆上不同角度点之间发生相应弯曲。可选的,所述格拉姆角和场矩阵的表达式如下:其中,I为单位向量,Xf为峰值波长范围内经过缩放后的局部一维度光谱吸光度序列,φi和φj分别为点i和点j的角度,和分别为波长为i/j对应的归一化后的有效光谱吸光度值。可选的,所述格拉姆角差场矩阵的表达式如下:其中,I为单位向量,Xf为峰值波长范围内经过缩放后的局部一维度光谱吸光度序列,φi和φj分别为点i和点j的角度,和分别为波长为i/j对应的归一化后的有效光谱吸光度值。可选的,所述训练后的卷积神经网络包括:输入层、第一卷积层、第二卷积层、第一池化层、第二池化层、第一全连接层以及第二全连接层,所述输入层、第一卷积层、第二卷积层、第一池化层、第二池化层、第一全连接层以及第二全连接层依次连接。可选的,所述训练后的卷积神经网络还包括:规范化层和正则化层,所述规范化层和所述正则化层位于所述第二卷基层和所述第一池化层中间。可选的,所述卷积神经网络中损失函数为交叉熵损失函数,具体公式如下:其中,a代表神经元的实际输出,y代表期望的输出。本专利技术另外提供一种一维光谱分类系统,所述系统包括:原始数据获取模块,用于获取m个待测样品的近红外光谱原始数据,记为X={x1,x2,…,xi,…,xn},n为总的波长点数,xi为标量;截取模块,用于截取所述近红外光谱原始数据中所有单一光谱序列的峰值数据;预处理模块,用于对所述峰值数据进行预处理;缩放模块,用于对所述预处理后的峰值数据进行缩放,得到一维度光谱信号数据极坐标编码模块,用于将所述缩放后的一维度光谱信号数据进行极坐标编码;重构模块,用于对所述极坐标编码后的一维度光谱信号数据进行重构,得到格拉姆角和场矩阵和格拉姆角差场矩阵;格式转换模块,用于将所述格拉姆角和场矩阵和所述格拉姆角差场矩阵存储为图像;图像划分模块,用于对所述图像进行划分,得到训练集和测试集;训练模块,用于采用所述训练集对卷积神经网络进行训练;分类结果确定模块,用于将所述测试集输入至训练好的卷积神经网络中,得到分类结果。根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果:本专利技术中的上述方法无需传统方法中大量的人工特征提取与降维等复杂操作,特征的可解释性强,可以实现光谱信号的自动提取、学习和分类;本专利技术方法通过格拉姆角场实现一维本文档来自技高网
...

【技术保护点】
1.一种一维光谱分类方法,其特征在于,所述分类方法包括:/n获取m个待测样品的近红外光谱原始数据,记为X={x

【技术特征摘要】
1.一种一维光谱分类方法,其特征在于,所述分类方法包括:
获取m个待测样品的近红外光谱原始数据,记为X={x1,x2,…,xi,…,xn},n为总的波长点数,xi为标量;
截取所述近红外光谱原始数据中所有单一光谱序列的峰值数据Xf;
对所述峰值数据进行预处理;
对所述预处理后的峰值数据进行缩放,得到一维度光谱信号数据;
将所述缩放后的一维度光谱信号数据进行极坐标编码;
对所述极坐标编码后的一维度光谱信号数据进行重构,得到格拉姆角和场矩阵和格拉姆角差场矩阵;
将所述格拉姆角和场矩阵和所述格拉姆角差场矩阵存储为图像;
对所述图像进行划分,得到训练集和测试集;
采用所述训练集对卷积神经网络进行训练;
将所述测试集输入至训练好的卷积神经网络中,得到分类结果。


2.根据权利要求1所述的一维光谱分类方法,其特征在于,在对所述图像进行划分,得到训练集和测试集之后还包括:
对所述训练集进行数据增强处理。


3.根据权利要求1所述的一维光谱分类方法,其特征在于,对所述预处理后的峰值数据进行缩放具体包括:
将所述预处理后的峰值数据缩放至[0,1]内,公式如下:

其中,为波长为i对应的归一化后的有效光谱吸光度值,xi为波长为i对应的原始光谱吸光度值,Xi为峰值波长范围内的光谱吸光度序列。


4.根据权利要求1所述的一维光谱分类方法,其特征在于,将所述缩放后的一维度光谱信号数据进行极坐标编码具体采用如下公式:

其中,为波长为i对应的归一化后的有效光谱吸光度值,r为半径,i={1,2,……,t},t为当前的波长点数,Xf为峰值波长范围内经过缩放后的局部一维度光谱吸光度序列。


5.根据权利要求1所述的一维光谱分类方法,其特征在于,所述格拉姆角和场矩阵的表达式如下:



其中,I为单位向量,Xf为峰值波长范围内经过缩放后的局部一维度光谱吸光度序列,φi和φj分别为点i和点j的角度,和分别为波长为i/j对应的归一化后的有效光谱吸光度值。


6.根据权利要求1所述的一维光谱分类方法,其特征在于...

【专利技术属性】
技术研发人员:王书涛刘诗瑜孔德明
申请(专利权)人:燕山大学
类型:发明
国别省市:河北;13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1