当前位置: 首页 > 专利查询>江苏大学专利>正文

一种自适应可能C均值聚类的茶叶中红外光谱分类方法技术

技术编号:17655705 阅读:34 留言:0更新日期:2018-04-08 08:48
本发明专利技术公开了一种自适应可能C均值聚类的茶叶中红外光谱分类方法,包括步骤:(1)茶叶样本中红外光谱采集;(2)用多元散射矫正(MSC)进行茶叶样本中红外光谱的预处理;(3)对茶叶样本中红外光谱进行降维处理和鉴别信息提取;(4)用自适应可能C均值聚类方法鉴别茶叶品种。本发明专利技术解决了用基于欧氏距离的改进型可能C‑均值(IPCM)聚类方法在聚类分析茶叶的中红外光谱数据时聚类效果不理想的问题,本发明专利技术采用基于模糊协方差矩阵的自适应距离测度来代替IPCM聚类方法中的欧氏距离测度。本发明专利技术具有检测速度快,检测准确率高,绿色无污染,所需茶叶样本少等优点。

【技术实现步骤摘要】
一种自适应可能C均值聚类的茶叶中红外光谱分类方法
本专利技术涉及茶叶品种分类领域,具体涉及一种自适应可能C均值聚类的茶叶中红外光谱分类方法。
技术介绍
茶叶是茶树的叶子经过一定工艺加工而成,人们喜欢将茶叶泡成饮品饮用。随着出口贸易市场的开放和国内市场流通的增多,快速准确的茶叶品种鉴别方法变得至关重要。然而传统的茶叶鉴别方法一般是由经验丰富的业内人士人工鉴别,效率和准确率都比较低下。中红外光谱检测技术作为一种快速无损检测技术,近年来应用于食品的检测分析中。中红外光谱的波数范围在4000cm-1~400cm-1之间,大多数的无机化合物和有机化合物的化学键振动的基频均在此区域。不同的分子中官能团、化合物的类别和化合物的立体结构,其中红外吸收光谱不尽相同。中红外光谱技术以其方便、快速、高效、无损、低成本等特点成为检测食品和药品的有效检测技术。改进型可能C-均值(IPCM)聚类方法(Zhang,J.-S.,Leung,Y.-W.,ImprovedpossibilisticC-meansclusteringalgorithms,IEEETrans.FuzzySystems,2004,12(2):209-217)解决了模糊C均值聚类(FCM)对噪声敏感和可能C-均值聚类(PCM)一致性聚类的缺点;但IPCM的目标函数中使用的是欧氏距离,在使用基于欧氏距离的IPCM处理不规则聚类形状的数据时,聚类准确率会受到影响。用中红外光谱仪采集多个品种茶叶的中红外光谱数据在进行数据降维后,各品种茶叶数据的边界往往是不规则形状的,如果用基于欧氏距离的IPCM来聚类分析茶叶的中红外光谱数据则效果往往不理想。
技术实现思路
本专利技术是针对现有的IPCM聚类方法在聚类茶叶中红外光谱数据时存在的缺点,提出一种自适应可能C均值聚类的茶叶中红外光谱分类方法,相比原有的IPCM聚类方法,本专利技术的一种自适应可能C均值聚类的茶叶中红外光谱分类方法采用基于模糊协方差矩阵的自适应距离测度来代替IPCM聚类方法中的欧氏距离测度。本专利技术具有检测速度快,检测准确率高,绿色无污染,所需茶叶样本少等优点。本专利技术依据的原理:研究表明茶叶的中红外漫反射光谱包含了茶叶内部的组分信息,不同品种茶叶所对应的中红外漫反射光谱不同,因而可以采用聚类方法将不同品种的茶叶中红外光谱进行分类。一种自适应可能C均值聚类的茶叶中红外光谱分类方法,具体包括以下步骤:S1,茶叶样本中红外光谱采集:针对不同种类茶叶样本,用中红外光谱仪对茶叶样本进行检测,获取茶叶样本中红外漫反射光谱信息,将光谱信息存储在计算机里;中红外漫反射光谱信息是指光谱的波数范围为4001.569~401.1211cm-1,采集到每个茶叶样本的光谱是1868维的数据;将茶叶样本分为训练样本和测试样本,设置类别数为c,训练样本数为nr,测试样本数为n。S2,用多元散射矫正(MSC)对茶叶样本中红外光谱预处理。S3,对茶叶样本中红外光谱进行降维处理和鉴别信息提取:利用主成分分析(PCA)将在S2中获得的茶叶样本中红外光谱数据压缩;然后利用线性判别分析(LDA)提取茶叶样本的鉴别信息。S4,对S3中包含鉴别信息的测试样本用自适应可能C均值聚类方法以鉴别测试样本中的茶叶品种;S4.1,初始化:设置权重指数m、w,类别数c,其中m>1、w>1;设置循环计数r的初始值和最大迭代次数rmax;设置迭代最大误差参数ε;运行模糊C均值聚类得到的模糊隶属度值和类中心值分别作为初始的模糊隶属度值uik(0)和类中心值νi(0);S4.2,计算第r(r=1,2,…,rmax)次迭代时的典型值:其中tik是样本xk隶属于类别i的典型值,tik(r)是第r次迭代计算的典型值,为样本xk到类中心vi的距离范数,且xk为第k个样本,vi是第i类的类中心值,νi(r-1)是第r-1次迭代计算的类中心vi的值;Sfi为模糊协方差矩阵,且d为样本的维数,n为样本数,uik(r-1)是第r-1次迭代计算的模糊隶属度值;S4.3,计算第r次迭代时的模糊隶属度值uik(r):其中uik是样本xk隶属于类别i的模糊隶属度值,uik(r)是第r次迭代计算的模糊隶属度值;S4.4,计算第r次迭代时第i类的类中心值νi(r):其中νi(r)是第r次迭代计算的类中心vi的值,由c个类中心值组成类中心矩阵V(r)=[ν1(r),ν2(r),…,νc(r)];S4.5,循环计数增加,即r=r+1;若满足条件:||V(r)-V(r-1)||<ε或r>rmax则计算终止,否则继续S4.2,根据计算得到的模糊隶属度值和典型值,实现不同种类茶叶分类。本专利技术的有益效果:1、本专利技术的一种自适应可能C均值聚类的茶叶中红外光谱分类方法,利用样本到类中心的距离范数,在聚类边界不规则的中红外光谱数据方面要优于改进型可能C-均值(IPCM)聚类方法,具有聚类准确率高,聚类速度快的优点。2、本专利技术采用样本隶属于类别的典型值,在聚类包含噪声数据的中红外光谱数据方面优于模糊C均值聚类(FCM),可快速实现不同品种的中红外光谱的快速和准确鉴别。附图说明图1是本专利技术的流程图;图2是茶叶的中红外光谱图;图3是MSC处理后的茶叶中红外光谱图;图4是茶叶的中红外光谱经LDA提取鉴别信息后得到的测试样本数据图;图5是初始的模糊隶属度值;图6是一种自适应可能C均值聚类方法产生的模糊隶属度;图7是一种自适应可能C均值聚类方法产生的典型值。具体实施方式下面结合附图和具体实施方式对本专利技术的装置及方法做进一步说明。如图1所示,一种自适应可能C均值聚类的茶叶中红外光谱分类方法,包括步骤:步骤一、茶叶样本中红外光谱采集:针对不同种类茶叶样本,用中红外光谱仪对茶叶样本进行检测,获取茶叶样本中红外漫反射光谱信息,将光谱信息存储在计算机里。实验过程中尽量保持室内的温度和湿度基本一致,中红外漫反射光谱信息是指光谱的波数范围为4001.569~401.1211cm-1,采集到每个茶叶样本的光谱是1868维的数据;将茶叶样本分为训练样本和测试样本,设置类别数c,训练样本数为nr和测试样本数为n。步骤二、用多元散射矫正(MSC)对茶叶样本中红外光谱预处理:用多元散射矫正(MSC)预处理,有效地减少茶叶样本的散射影响,增强了与茶叶样本相关的光谱吸收信息,提高茶叶鉴别的识别率;步骤三、对茶叶样本中红外光谱进行降维处理和鉴别信息提取:利用主成分分析(PCA)将在步骤二中获得的茶叶样本中红外光谱数据压缩;然后用线性判别分析(LDA)提取茶叶样本的鉴别信息。步骤四、对步骤三中包含鉴别信息的测试样本,使用自适应可能C均值聚类方法,以鉴别测试样本中的茶叶品种。步骤四的具体过程如下:A、初始化过程:设置权重指数m(m>1)和权重指数w(w>1),类别数c;设置循环计数r的初始值和最大迭代次数为rmax;设置迭代最大误差参数ε;运行模糊C均值聚类得到的模糊隶属度值和类中心值分别作为初始的模糊隶属度值uik(0)和类中心值νi(0);B、计算第r(r=1,2,…,rmax)次迭代时的典型值:其中:tik是样本xk隶属于类别i的典型值,tik(r)是第r次迭代计算的典型值,为样本xk到类中心v本文档来自技高网
...
一种自适应可能C均值聚类的茶叶中红外光谱分类方法

【技术保护点】
一种自适应可能C均值聚类的茶叶中红外光谱分类方法,其特征在于,包括以下步骤:S1,茶叶样本中红外光谱采集:针对不同种类茶叶样本,用中红外光谱仪对茶叶样本进行检测,获取茶叶样本中红外漫反射光谱信息,将光谱信息存储在计算机里;将茶叶样本分为训练样本和测试样本;S2,用多元散射矫正MSC对茶叶样本中红外光谱进行预处理;S3,对茶叶样本中红外光谱进行降维处理和鉴别信息提取;S4,对S3中包含鉴别信息的测试样本,使用自适应可能C均值聚类方法鉴别出测试样本中的茶叶品种。

【技术特征摘要】
1.一种自适应可能C均值聚类的茶叶中红外光谱分类方法,其特征在于,包括以下步骤:S1,茶叶样本中红外光谱采集:针对不同种类茶叶样本,用中红外光谱仪对茶叶样本进行检测,获取茶叶样本中红外漫反射光谱信息,将光谱信息存储在计算机里;将茶叶样本分为训练样本和测试样本;S2,用多元散射矫正MSC对茶叶样本中红外光谱进行预处理;S3,对茶叶样本中红外光谱进行降维处理和鉴别信息提取;S4,对S3中包含鉴别信息的测试样本,使用自适应可能C均值聚类方法鉴别出测试样本中的茶叶品种。2.如权利要求1所述的一种自适应可能C均值聚类的茶叶中红外光谱分类方法,其特征在于,所述S1中红外漫反射光谱信息是指光谱的波数范围为4001.569~401.1211cm-1,采集到每个茶叶样本的光谱是1868维的数据。3.如权利要求1所述的一种自适应可能C均值聚类的茶叶中红外光谱分类方法,其特征在于,所述S1中设置茶叶样本的类别数为c,训练样本数为nr,测试样本数为n。4.如权利要求1所述的一种自适应可能C均值聚类的茶叶中红外光谱分类方法,其特征在于,所述S3具体为:利用主成分分析PCA将在S2中获得的茶叶样本中红外光谱数据压缩,然后利用线性判别分析LDA提取茶叶样本的鉴别信息。5.如权利要求1所述的一种自适应可能C均值聚类的茶叶中红外光谱分类方法,其特征在于,所述S4具体为:S4.1,初始化:设置权重指数m、w,类别数c,其中m>1、w>1;设置循环计数r的初始值和最大迭代次数rmax;设置迭代最大误差参数ε;运行模糊C均值聚类得到的模糊隶属度值和类中心值分别作为初始的模糊隶属度值ui...

【专利技术属性】
技术研发人员:武小红崔艳海陈勇郭蓓蓓武斌孙俊傅海军戴春霞
申请(专利权)人:江苏大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1