一种基于太赫兹时域光谱的芝麻油品种识别方法技术

技术编号:25705971 阅读:33 留言:0更新日期:2020-09-23 02:53
现有的油类识别技术针对的是不同种类的鉴别,而对同一种油类不同品牌的识别尚未有好快速有效的方法。为了实现对芝麻油品种的快速鉴别,提出了一种基于太赫兹时域光谱(THz‑TDS)的芝麻油品种识别的方法。选取0~2.5THz范围内的光谱进行分析,通过主成分分析法(PCA)对时域光谱数据进行降维,选择前4个主成分(累计贡献率大于99%)代表原始数据,然后利用支持向量机(SVM)方法对不同品种芝麻油进行分类识别,分类时使用3种不同的核函数建模,并采用网格搜索算法获得最优模型及其模型参数。本发明专利技术能够快速有效的进行芝麻油品种的鉴别。

【技术实现步骤摘要】
一种基于太赫兹时域光谱的芝麻油品种识别方法
本专利技术属于光谱数据处理
,具体涉及到一种用于芝麻油品种识别的方法。
技术介绍
传统的识别芝麻油的方法主要有电导法和色谱法,其中色谱法可以分为气相色谱法、液相色谱法和薄层色谱法等,传统方法有很多局限性,如样品需要预处理、耗时长、操作复杂、损害样品等。近年来光谱法成为一种新兴的识别食用油的方法,光谱法可以不破坏样品从而实现无损检测,主要有近红外光谱法、拉曼光谱法和荧光光谱法等。但由于光谱信号重叠或光谱中包含有用信息较少,这些方法有一定的局限性。太赫兹波是一种介于微波和红外之间的电磁波,频率范围在0.3~10Thz,太赫兹辐射具有良好的透视性、安全性和光谱分辨率。已经在安全检查、对化学和生物制剂的检测、环境控制、医疗诊断等领域得到了广泛的应用。目前在农产品和食品安全领域的应用也在不断增多,如农产品和食品含水量检测、食品内部品质检测和种子识别识别等。因此本专利技术主要关注于如何使用太赫兹时域光谱技术对芝麻油的品种进行鉴别。
技术实现思路
使用太赫兹时域光谱仪对芝麻油样品进行检测,获得样品的时域光谱数据,每组数据有580维,使用Origin软件对光谱数据进行预处理,对样品信号和参考信号进行快速傅里叶变换,得到样品的频谱和参考信号的频谱。本次实验使用的光谱仪采用的是透射式的扫描方式,样品的吸收系数和折射率可以通过与参考光谱的比较中得出来:(1)(2)其中为吸收系数,为折射率,为样品厚度,c为真空中的光速。利用上述公式可以计算出样品的吸收系数和折射率。继续对吸收系数和折射率进行预处理,采用了微分、积分和归一化三种方法分别对数据进行预处理,采用微分和积分处理后的数据依旧不容易区分,采用归一化处理后的数据可以比较明显的区分出不同品种的芝麻油,所以选择归一化处理作为最终的预处理方法,然后对预处理后的数据继续采用机器学习的算法进一步分类。采用PCA降维,保留前4个主成分,使用前4个主成分代替原始数据集,作为SVM分类模型的输入。为了更加精确快速的区分,继续采用SVM进行分类。采用PCA-SVM联用模型对样品进行分类,先对原始数据集进行划分,训练集和测试集的比例为7:3。为了得到更好的分类效果,实验采用网格搜索算法得出分类准确率最高的参数组合。主要对核函数(kernel)、惩罚函数(C)、核函数系数(γ)进行搜索。最佳分类效果的参数为惩罚函数C为0.01,核函数系数γ为0.1。该方法能够快速有效的进行芝麻油品种的鉴别。附图说明图1一种用于芝麻油鉴别的太赫兹光谱数据处理方法流程图。具体实施方式为了验证本专利技术的芝麻油品种识别性能,我们选自市面上四种不同品种芝麻油,使用太赫兹光谱仪进行检测,得到样品的太赫兹光谱数据。步骤一:对光谱数据进行预处理,使用Origin软件对光谱数据进行傅里叶变换得到频谱数据,然后使用公式计算得到吸收系数和折射率。步骤二:使用PCA对光谱数据进行降维处理,将原来的580维数据降维处理,选取前4个主成分代替原始数据。步骤三:采用PCA-SVM联用模型对样品进行分类,先对数据集进行划分,训练集和测试集的比例为7:3。采用网格搜索算法得出分类准确率最高的参数组合。主要对核函数(kernel)、惩罚函数(C)、核函数系数()进行搜索。最终选择参数为惩罚函数C为0.01,核函数系数为0.1,得到的分类效果准确率如下表。表3不同核函数的分类准确率实验结果表明,本专利技术使用的PCA-SVM联用模型能够快速有效的进行芝麻油品种分类,并且核函数参数以及惩罚系数参数相对于其他的分类准确率高,证明该方法能够有效的进行芝麻油品种分类。本文档来自技高网...

【技术保护点】
1.本专利技术公布了一种用于芝麻油品种鉴别的方法,包括以下步骤:/n(1)数据预处理:将太赫兹光谱仪测得的光谱数据进行预处理,由于在测量过程中受到环境因素的影响,需要将测得的数据进行预处理,因为后面波段受到的干扰较大,所以选取0~2.5 THz范围内的波形进行观测,并采用归一化预处理的方式对计算所得的吸收系数进行预处理;/n(2)特征提取:原始数据为580维,直接使用SVM分类效率会比较低,所以先采用PCA进行特征提取,最终保留前4个主成分,使用前4个主成分代替原始数据集,作为SVM分类模型的输入;数据将进行以下流程:/nA.原始数据组成矩阵

【技术特征摘要】
1.本发明公布了一种用于芝麻油品种鉴别的方法,包括以下步骤:
(1)数据预处理:将太赫兹光谱仪测得的光谱数据进行预处理,由于在测量过程中受到环境因素的影响,需要将测得的数据进行预处理,因为后面波段受到的干扰较大,所以选取0~2.5THz范围内的波形进行观测,并采用归一化预处理的方式对计算所得的吸收系数进行预处理;
(2)特征提取:原始数据为580维,直接使用SVM分类效率会比较低,所以先采用PCA进行特征提取,最终保留前4个主成分,使用前4个主成分代替原始数据集,作为SVM分类模型的输入;数据将进行以下流程:
A.原始数据组成矩阵将样本去中心化,为方便表示仍用X表示去中心化后的矩阵;
B.计算协方差矩阵



C.计算协方差矩阵的特征值和特征向量
构造特征方程:



计算得特征值和特征向量,
D.将特征值降序排序得

【专利技术属性】
技术研发人员:武国芳吕明葛宏义张元
申请(专利权)人:河南工业大学
类型:发明
国别省市:河南;41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1