当前位置: 首页 > 专利查询>安徽大学专利>正文

一种太平猴魁茶近红外光谱制造技术

技术编号:39589448 阅读:17 留言:0更新日期:2023-12-03 19:41
本发明专利技术属于近红外光谱技术领域,涉及一种太平猴魁茶近红外光谱

【技术实现步骤摘要】
一种太平猴魁茶近红外光谱FS

SC半监督特征选择方法


[0001]本专利技术属于近红外光谱
,涉及一种太平猴魁茶近红外光谱
FS

SC
半监督特征选择方法


技术介绍

[0002]太平猴魁茶,属于绿茶尖茶,主要产于安徽省黄山市黄山区三合村猴坑

猴岗

严家三个自然村落的凤凰山

狮彤山

鸡公山

鸡公尖一带

因选用特有的柿大茶为主要茶树品种,以及采用独特的加工手艺,其成品深受广大消费者喜爱,被列为中国十大名茶之一

但是太平猴魁茶的品质与茶树生长土壤环境

品种和制作工艺等因素密切相关

茶叶特征成分的差异导致不同产地的太平猴魁茶市场价格相差悬殊,市场价格的差异导致“以次充好”与“掺假”等现象不断发生,该现象严重破坏了太平猴魁茶市场健康

稳定的发展

[0003]传统甄别方法主要通过人工经验实现茶叶产地

等级甄别分析,但由于太平猴魁茶主要产地地理位置相近,其相邻产地茶叶成品之间内含成分种类基本相同;此外,经传统手工制备的茶叶成品外观差异较小,这导致基于人工经验的感官评审方法无法实现快速

高精度的产地甄别分析

目前主要通过化学分析矿物元素含量方法实现产地甄别分析,现有技术中,叶子弘等提出的申请公布号为
CN106560697A
的中国专利技术专利申请

联合近红外光谱和微量元素的武夷岩茶产地鉴别方法

,结合近红外光谱与矿物元素含量,实现了武夷岩茶产地的甄别

虽然结合矿物元素含量分析的甄别方法虽然能够区分一定区域茶叶甄别,但是矿物元素分析属于化学分析,其检测过程成本高

周期长

分析过程较为复杂

其生成物对环境具有破坏性

此外,我国目前没有统一的茶叶矿物元素含量检测标准,对于太平猴魁等特定产区的茗茶而言,相近生产区域的不同产地样本之间矿物元素分布基本相同,无法有效地通过分析矿物元素含量进行产地甄别分析

[0004]近红外光谱是介于可见光和中红外之间的电磁辐射波,其波长范围是
780nm

2526nm。
近红外光谱穿透能力较强,且近红外光谱取与有机分子中含氢基团振动的合频和各级倍频的吸收区一致,能够携带样本中有机分子丰富的含氢基团的特征信息,更适用于有机物质成分分析

近年来,近红外光谱技术以其在相对准确的基础上,兼有快速

简便等优点而迅速得到各个领域的亲睐,成为一种新兴的分析与研究手段

近红外光谱分析中应用最为普遍的一种定性定量分析模型建立方法为偏最小二乘法,与主成分回归一样,偏最小二乘法也属于因子分析方法,在建模过程中需要对光谱矩阵进行分解,分解过程提取出少数几个潜变量就能代表原光谱的大部分信息,在偏最小二乘回归中这些变量称之为主成分,但偏最小二乘回归在主成分提取过程中不仅考虑了检测目标向量,还要使提取出的主成分与检测目标向量间的协方差最大化,这保证了主成分与检测目标向量之间具有最大的相关性

[0005]在建立校正模型前,需要使用光谱预处理方法对原始近红外光谱数据进行光谱校正,削弱甚至消除基线漂移

谱峰重叠

噪声等现象

目前应用较广的近红外光谱处理方法主要包括标准正态变换,多元散射校正,平滑滤波,基线校正等

现有的预处理可以消除原
始光谱数据里包含的噪声信息,突出不同样本光谱信号间的差异,简化后续所建模型的复杂度和提高模型性能与泛化能力

[0006]由于近红外光谱数据特征维度高,在实际检测过程中,有标签数据的稀少和标记处理昂贵,获取完整的有标记数据集变得更加困难,且实践中经常需要处理部分标签信息缺失的数据集,有监督特征选择方法无法利用全部的样本,所以仅仅使用少量的有标签数据难以充分挖掘近红外光谱数据类别的特征


技术实现思路

[0007]本专利技术的技术方案用于解决现有技术依靠少量有标签近红外光谱样本无法充分挖掘特征关键变量,而导致的校正模型预测能力性能差的问题

[0008]本专利技术是通过以下技术方案解决上述技术问题的:
[0009]一种太平猴魁茶近红外光谱
FS

SC
半监督特征选择方法,包括如下步骤:
[0010]S1、
采集太平猴魁茶的近红外光谱光强数据,形成太平猴魁茶的原始近红外光谱数据集其中包含
N
个近红外光谱数据样本,每个样本包含
M
列特征变量;
[0011]S2、
采用标准正态变换对原始近红外光谱数据集进行预处理;
[0012]S3、
预处理后的近红外光谱数据集随机划分为有标签样本

无标签样本,标签为:核心产区和非核心产区;有标签样本再按比例随机划分为校正集与测试集;
[0013]S4、
对有标签样本进行有监督
Fisher Score
得分计算,对无标签样本进行无监督
Silhouette Coefficient
得分计算,在有监督
Fisher Score
得分和无监督
Silhouette Coefficient
得分之间加一个权重因子,得到最后的半监督得分,将半监督得分进行排序,得分最高的便是所要选择得特征变量;
[0014]S5、
建立偏最小二乘法预测判别模型,用步骤
S4
得到的特征变量训练偏最小二乘法预测判别模型,再用校正集与测试集对模型进行校正与测试,最后用于对无标签样本进行预测

[0015]进一步地,步骤
S2
中所述的标准正态变换的公式如下:
[0016][0017]其中,为平均光谱,
X
j
为原始近红外光谱数据集中的第
j
个近红外光谱数数据样本

[0018]进一步地,步骤
S4
中所述的对有标签样本进行有监督
Fisher Score
得分计算的公式如下:
[0019][0020]其中,
n
+
为有标签样本中核心产区的样本数目,
n

为有标签样本中非核心产区的样本数目;代表核心产区样本的第
i
个特征值,代表非核心产区样本的第
i
个特征值,代
表第
i
个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种太平猴魁茶近红外光谱
FS

SC
半监督特征选择方法,其特征在于,包括如下步骤:
S1、
采集太平猴魁茶的近红外光谱光强数据,形成太平猴魁茶的原始近红外光谱数据集其中包含
N
个近红外光谱数据样本,每个样本包含
M
列特征变量;
S2、
采用标准正态变换对原始近红外光谱数据集进行预处理;
S3、
将预处理后的近红外光谱数据集随机划分为有标签样本

无标签样本,标签为:核心产区和非核心产区;有标签样本再按比例随机划分为校正集与测试集;
S4、
对有标签样本进行有监督
Fisher Score
得分计算,对无标签样本进行无监督
Silhouette Coefficient
得分计算,在有监督
Fisher Score
得分和无监督
Silhouette Coefficient
得分之间加一个权重因子,得到最后的半监督得分,将半监督得分进行排序,得分最高的便是所要选择的特征变量;
S5、
建立偏最小二乘法预测判别模型,用步骤
S4
得到的特征变量训练偏最小二乘法预测判别模型,再用校正集与测试集对模型进行校正与测试,最后用于对无标签样本进行预测
。2.
根据权利要求1所述的太平猴魁茶近红外光谱
FS

SC
半监督特征选择方法,其特征在于,步骤
S2
中所述的标准正态变换的公式如下:其中,为平均光谱,
X
j
为原始近红外光谱数据集中的第
j
个近红外光谱数数据样本
。3.
根据权利要求2所述的太平猴魁茶近红外光谱
FS

SC
半监督特征选择方法,其特征在于,步骤
S4
中所述的对有标签样本进行有监督
Fisher Score
得分计算的公式如下:其中,
n
+
为有标签样本中核心产区的样本数目,
n

为有标签样本中非核心产区的样本数目;代表核心产区样本的第
i
个特征值,代表非核心产区样本的第
i
个特征值,代表第
i
个特征值的平均值;代表核心产区样本中第
k
个样本的第
i
个特征值,代表非核心产区样本中第
k
个样本的第
i
个特征值
。4.
根据权利要求3所述的太平猴魁茶近红外光谱
FS

SC
半监督...

【专利技术属性】
技术研发人员:潘天红陈支峰田佳强樊渊吴琼余晓峰
申请(专利权)人:安徽大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1