当前位置: 首页 > 专利查询>江苏大学专利>正文

一种模糊线性机器学习的茶叶品种分类方法技术

技术编号:28466574 阅读:18 留言:0更新日期:2021-05-15 21:32
本发明专利技术公开了一种模糊线性机器学习的茶叶品种分类方法,通过采集待分类茶叶样本的近红外光谱数据;用多元散射校正对所采集的近红外光谱数据进行校正处理;从处理后的近红外光谱数据提取茶叶近红外光谱模糊鉴别信息;建立模糊聚类目标函数和约束条件,采用基于p范数距离测度的模糊聚类方法迭代更新茶叶的模糊隶属度值,根据所得到的模糊隶属度值对茶叶进行分类。本发明专利技术所提出的分类方法能够解决传统模糊线性判别分析的小样本问题。模糊线性判别分析的小样本问题。模糊线性判别分析的小样本问题。

【技术实现步骤摘要】
一种模糊线性机器学习的茶叶品种分类方法


[0001]本专利技术涉及模糊线性机器学习以及人工智能领域,具体涉及到一种模糊线性机器学习的茶叶品种分类方法。

技术介绍

[0002]我国有着悠久的茶文化历史,茶叶中含有的茶多酚、咖啡碱和可溶性固形物等化学成分有益于身体健康。目前,中国的茶叶市场相对混乱,特别是名优茶市场,以次充好和以假乱真的现象比较严重,这既损害了消费者的利益,也不利于中国茶叶品牌的保护。近红外光谱检测技术具有快速、无损的特点,因此,利用近红外光谱技术对茶叶进行快速准确的分类是必要的。基于线性机器学习能够将大量光谱信息进行分类整理,将信息得到简化的优点,故在线性机器学习的基础上利用近红外光谱检测技术对茶叶进行分类。同时,这种技术也可以应用于其他农作物,具有极大的研究意义和价值。
[0003]近红外光谱是一种介于可见光和中红外光之间的电磁波,波长为750~2500nm之间的光谱区。近红外光谱为分子振动光谱的倍频和组合频谱带,主要指含氢基团的吸收,包含了绝大多数有类型机物组成和分子结构的丰富信息,同时具有无损性、成本低、检测速度快等优点,因此广泛作为一种检测技术应用于农副产品检测领域。根据不同品种茶叶具有不同的近红外光谱,为茶叶分类提供了可能。
[0004]模糊线性判别分析(FLDA)在模糊集的基础上,将高维度的空间样本投影到低维度空间上,使得样本按照类内距离最小,类间距离最大规则而实现分类的效果,能够有效地提取样本的鉴别信息。
[0005]聚类算法分为两大类,第一类算法是硬聚类算法例如k均值聚类算法等,将一个数据集分为不同的类,每个样本只属于某一类。第二类为模糊聚类算法,该算法允许一个样本属于多类,用模糊隶属度来衡量样本隶属于某类的程度。模糊C均值聚类算法(FCM)建立在平方误差最小准则基础上的模糊聚类算法,使某样本在所有类中模糊隶属度之和为1,有效地避免了所有隶属度为0的解,但由于FCM对噪声数据敏感,因此不准确的隶属度会影响聚类中心的位置从而影响模糊隶属度的值,降低了聚类准确率。

技术实现思路

[0006]为了解决现有技术中存在的不足,本专利技术提出了一种模糊线性机器学习的茶叶品种分类方法,通过奇异值分解等计算方法计算变换矩阵,以提取茶叶近红外光谱的鉴别信息;接着采用能够聚类包含噪声数据,使噪声数据具有很小隶属度值,基于p范数距离测度的一种模糊聚类算法以消除噪声数据对聚类的影响。
[0007]本专利技术所采用的技术方案如下:
[0008]一种模糊线性机器学习的茶叶品种分类方法,包括以下步骤:
[0009]S1,采集待分类茶叶样本的近红外光谱数据;
[0010]S2,用多元散射校正(MSC)对所采集的近红外光谱数据进行校正处理;
[0011]S3,从S2处理后的近红外光谱数据提取茶叶近红外光谱模糊鉴别信息;
[0012]S4,建立模糊聚类目标函数和约束条件,采用基于p范数距离测度的模糊聚类方法迭代更新茶叶的模糊隶属度值,根据所得到的模糊隶属度值对茶叶进行分类。
[0013]进一步,提取茶叶近红外光谱模糊鉴别信息的方法为:
[0014]S3.1,初始化参数:训练样本数为n1、测试样本数为n2、权重指数为m,类别数为c;
[0015]S3.2,计算第k个训练样本隶属于第i类的模糊隶属度μ
ik

[0016]S3.3,一种模糊隶属度μ
ik
计算模糊类间离散度矩阵S
fB
和模糊类内离散度矩阵S
fW
;对糊类间离散度矩阵S
fB
和模糊类内离散度矩阵S
fW
之和进行奇异值分解得到特征矩阵U;
[0017]S3.4,基于特征矩阵U,计算优化变换矩阵G;
[0018]S3.5,利用变换矩阵G对分别对第t个测试样本和第k个训练样本进行变换得到和y
k

[0019]S3.6,利用线性判别分析分别将测试样本和测试样本y
k
转化为测试样本和z
k

[0020]进一步,所述糊类间离散度矩阵S
fB
和模糊类内离散度矩阵S
fW
表示为:
[0021][0022][0023]其中,为在权重指数为m的第k个训练样本隶属于第i类的模糊隶属度;为所有训练样本采集的近红外光谱数据的均值,x
k
为第k个训练样本采集到的近红外光谱数据;v
i
指训练样本中第i类茶叶近红外光谱数据的均值,i=1,2,...,c。
[0024]进一步,所述优化变换矩阵G表示为:
[0025]G=UQM
[0026]其中,Q表示对矩阵进行特征分解,由非零特征值所对应的特征向量组成的矩阵;M表示对进行特征分解得到的非零特征值所对应的特征向量组成矩阵;且
[0027]进一步,S3.5中和y
k
分别表示为:y
k
=x
k
G,其中,是基于矩阵G进行变换后待分类的样本数据;y
k
是基于矩阵G进行变换后的训练样本数据。
[0028]进一步,所述模糊聚类目标函数表示为:
[0029][0030]其中,J(μ
it
,v
i
)为目标函数,为在权重指数m
f
下第t个测试样本z
t
隶属于第i(1≤i≤c)类的模糊隶属度;η
i
为第i类的参数值,μ
it
为第t个测试样本隶属于第i类的模糊隶属度,γ
i
是第i类的类中心,权重指数m
f

[0031]进一步,约束条件表示为:指数p>1。
[0032]进一步,设定迭代次数,根据模糊聚类目标函数和约束条件分别计算模糊隶属度值μ
it
和类中心γ
i
;其中,模糊隶属度表示为:
[0033][0034]类中心表示为:
[0035][0036]第i类的参数值η
i
计算如下:
[0037][0038]其中,在权重指数m下运行模糊C均值聚类(FCM)后得到的第t个测试样本隶属于第i类的模糊隶属度值和v
i,FCM
是运行FCM后得到的类中心。
[0039]进一步,用傅里叶近红外光谱仪对茶叶样本进行检测,获取茶叶样本近红外漫反射光谱数据。
[0040]进一步,每个样本采样3次,3次平均值作后续实验样本的数据。
[0041]本专利技术的有益效果:
[0042]本专利技术所设计的分类方法能够解决传统模糊线性判别分析的小样本问题,通过设计一种模糊线性机器学习的茶叶品种分类方法,通过奇异值分解等计算方法计算变换矩阵,以提取茶叶近红外光谱的鉴别信息。接着采用能够聚类包含噪声数据,使噪声数据具有很小隶属度值,基于p范数距离测度的一种模糊聚类算本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模糊线性机器学习的茶叶品种分类方法,其特征在于,包括以下步骤:S1,采集待分类茶叶样本的近红外光谱数据;S2,用多元散射校正对所采集的近红外光谱数据进行校正处理;S3,从S2处理后的近红外光谱数据提取茶叶近红外光谱模糊鉴别信息;S4,建立模糊聚类目标函数和约束条件,采用基于p范数距离测度的模糊聚类方法迭代更新茶叶的模糊隶属度值,根据所得到的模糊隶属度值对茶叶进行分类。2.根据原理要求1所述的一种模糊线性机器学习的茶叶品种分类方法,其特征在于,提取茶叶近红外光谱模糊鉴别信息的方法为:S3.1,初始化参数:训练样本数为n1、测试样本数为n2、权重指数为m,类别数为c;S3.2,计算第k个训练样本隶属于第i类的模糊隶属度μ
ik
;S3.3,基于模糊隶属度μ
ik
计算模糊类间离散度矩阵S
fB
和模糊类内离散度矩阵S
fW
;对糊类间离散度矩阵S
fB
和模糊类内离散度矩阵S
fW
之和进行奇异值分解得到特征矩阵U;S3.4,基于特征矩阵U,计算优化变换矩阵G;S3.5,利用变换矩阵G对分别对第t个测试样本和第k个训练样本进行变换得到和y
k
;S3.6,利用线性判别分析分别将测试样本和测试样本y
k
转化为测试样本和z
k
。3.根据原理要求1所述的一种模糊线性机器学习的茶叶品种分类方法,其特征在于,所述糊类间离散度矩阵S
fB
和模糊类内离散度矩阵S
fW
表示为:表示为:其中,为在权重指数为m的第k个训练样本隶属于第i类的模糊隶属度;为所有训练样本采集的近红外光谱数据的均值,x
k
为第k个训练样本采集到的近红外光谱数据;v
i
指训练样本中第i类茶叶近红外光谱数据的均值,i=1,2,...,c。4.根据原理要求3所述的一种模糊线性机器学习的茶叶品种分类方法,其特征在于,所述优化变换矩阵G表示为:G=UQM其中,Q表示对矩阵进行特征分解,由非...

【专利技术属性】
技术研发人员:李晓武小红金祖敏冯亚杰
申请(专利权)人:江苏大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1