【技术实现步骤摘要】
一种太平猴魁茶近红外光谱FS
‑
SC半监督特征选择方法
[0001]本专利技术属于近红外光谱
,涉及一种太平猴魁茶近红外光谱
FS
‑
SC
半监督特征选择方法
。
技术介绍
[0002]太平猴魁茶,属于绿茶尖茶,主要产于安徽省黄山市黄山区三合村猴坑
、
猴岗
、
严家三个自然村落的凤凰山
、
狮彤山
、
鸡公山
、
鸡公尖一带
。
因选用特有的柿大茶为主要茶树品种,以及采用独特的加工手艺,其成品深受广大消费者喜爱,被列为中国十大名茶之一
。
但是太平猴魁茶的品质与茶树生长土壤环境
、
品种和制作工艺等因素密切相关
。
茶叶特征成分的差异导致不同产地的太平猴魁茶市场价格相差悬殊,市场价格的差异导致“以次充好”与“掺假”等现象不断发生,该现象严重破坏了太平猴魁茶市场健康
、
稳定的发展
。
[0003]传统甄别方法主要通过人工经验实现茶叶产地
、
等级甄别分析,但由于太平猴魁茶主要产地地理位置相近,其相邻产地茶叶成品之间内含成分种类基本相同;此外,经传统手工制备的茶叶成品外观差异较小,这导致基于人工经验的感官评审方法无法实现快速
、
高精度的产地甄别分析
。
目前主要通过化学分析矿物元素含量方法实现产地甄别分析,现有技术中,叶子弘等提出 ...
【技术保护点】
【技术特征摘要】
1.
一种太平猴魁茶近红外光谱
FS
‑
SC
半监督特征选择方法,其特征在于,包括如下步骤:
S1、
采集太平猴魁茶的近红外光谱光强数据,形成太平猴魁茶的原始近红外光谱数据集其中包含
N
个近红外光谱数据样本,每个样本包含
M
列特征变量;
S2、
采用标准正态变换对原始近红外光谱数据集进行预处理;
S3、
将预处理后的近红外光谱数据集随机划分为有标签样本
、
无标签样本,标签为:核心产区和非核心产区;有标签样本再按比例随机划分为校正集与测试集;
S4、
对有标签样本进行有监督
Fisher Score
得分计算,对无标签样本进行无监督
Silhouette Coefficient
得分计算,在有监督
Fisher Score
得分和无监督
Silhouette Coefficient
得分之间加一个权重因子,得到最后的半监督得分,将半监督得分进行排序,得分最高的便是所要选择的特征变量;
S5、
建立偏最小二乘法预测判别模型,用步骤
S4
得到的特征变量训练偏最小二乘法预测判别模型,再用校正集与测试集对模型进行校正与测试,最后用于对无标签样本进行预测
。2.
根据权利要求1所述的太平猴魁茶近红外光谱
FS
‑
SC
半监督特征选择方法,其特征在于,步骤
S2
中所述的标准正态变换的公式如下:其中,为平均光谱,
X
j
为原始近红外光谱数据集中的第
j
个近红外光谱数数据样本
。3.
根据权利要求2所述的太平猴魁茶近红外光谱
FS
‑
SC
半监督特征选择方法,其特征在于,步骤
S4
中所述的对有标签样本进行有监督
Fisher Score
得分计算的公式如下:其中,
n
+
为有标签样本中核心产区的样本数目,
n
‑
为有标签样本中非核心产区的样本数目;代表核心产区样本的第
i
个特征值,代表非核心产区样本的第
i
个特征值,代表第
i
个特征值的平均值;代表核心产区样本中第
k
个样本的第
i
个特征值,代表非核心产区样本中第
k
个样本的第
i
个特征值
。4.
根据权利要求3所述的太平猴魁茶近红外光谱
FS
‑
SC
半监督...
【专利技术属性】
技术研发人员:潘天红,陈支峰,田佳强,樊渊,吴琼,余晓峰,
申请(专利权)人:安徽大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。