一种模糊非相关C均值聚类的茶叶红外光谱分类方法技术

技术编号：19565862 阅读：36 留言：0更新日期：2018-11-25 01:57

本发明专利技术公开了一种模糊非相关C均值聚类的茶叶红外光谱分类方法，本发明专利技术的方法能够在模糊C均值聚类过程中动态提取茶叶红外光谱数据的模糊非相关鉴别信息，可提高茶叶品种鉴别的准确率。首先用傅里叶红外光谱分析仪采集茶叶样本的红外光谱；接着对红外光谱进行多元散射校正预处理；然后用主成分分析法将光谱数据降维到20维；再利用线性判别分析提取光谱数据中的鉴别信息；最后用一种模糊非相关C均值聚类方法进行茶叶品种的分类。本发明专利技术在模糊C均值聚类方法基础上设计了一种模糊非相关C均值聚类方法，具有检测速度快，分类速度快，分类准确率高等优点，可实现茶叶品种的正确分类。

A Classification Method of Tea Infrared Spectrum Based on Fuzzy Uncorrelated C-Means Clustering

The invention discloses a tea infrared spectrum classification method based on Fuzzy non-correlation C-means clustering. The method can extract the fuzzy non-correlation identification information of tea infrared spectrum data dynamically in the process of fuzzy C-means clustering, and can improve the accuracy of tea variety identification. Firstly, the infrared spectra of tea samples were collected by Fourier transform infrared spectroscopy (FTIR) analyzer; secondly, the infrared spectra were pre-processed by multiple scattering correction; secondly, the spectral data were reduced to 20 dimensions by principal component analysis (PCA); then, the discriminant information was extracted from the spectral data by linear discriminant analysis; finally, a kind of fuzzy non-correlation C-means clustering was used. Classification methods were used to classify tea varieties. Based on the fuzzy C-means clustering method, the present invention designs a fuzzy non-correlation C-means clustering method, which has the advantages of fast detection speed, fast classification speed and high classification accuracy, and can realize the correct classification of tea varieties.

全部详细技术资料下载

【技术实现步骤摘要】
一种模糊非相关C均值聚类的茶叶红外光谱分类方法
本专利技术涉及一种茶叶分类方法，具体涉及一种模糊非相关C均值聚类的茶叶红外光谱分类方法。
技术介绍
饮茶是中国人的传统饮食文化。茶叶中含有茶多酚，茶多糖和茶氨酸等有益人体健康的物质。目前，市场上茶叶品种众多，茶叶质量的重要性已渐渐被人们所重视。但是，市场上茶叶良莠不齐，品种众多，其优劣难以分辨。因此，研究出一种快速有效的鉴别茶叶品种的方法十分重要。红外光谱主要用于有机化合物的定性和定量分析。红外光谱技术作为一种无损检测技术，近年来，已经在农产品和食品安全检测等领域得到广泛应用。例如：杨新河等利用傅里叶红外光谱法对黑茶进行鉴别研究。Ayvaz等用便携式中红外系统收集马铃薯汁的中红外光谱，利用归一化和Savitzky-Golay二阶多项式滤波器进行光谱预处理，再用偏最小二乘回归建立校正模型预测七种不同颜色马铃薯的花青素，酚醛物质和糖含量。在众多的模糊聚类算法中基于目标函数的模糊聚类由于其具有设计简单、解决问题的范围广,最终可以归结为优化问题等优点而成为目前应用最广泛的模糊聚类算法。其中模糊C-均值聚类是基于目标函数的聚类算法中最具代表性的聚类算法。但是模糊C-均值聚类FCM在模糊聚类过程中无法动态提取样本的鉴别信息。为了解决这个问题，本专利技术设计了一种模糊非相关C均值聚类方法。该方法可实现模糊C均值聚类过程中进行数据模糊非相关鉴别信息的提取，可以达到更高的聚类准确率。
技术实现思路
本专利技术的目的在于克服现有技术存在的上述缺陷，提供一种检测速度快、分类准确率高、分类效率高的一种模糊非相关C均值聚类的茶叶红外光谱分...

【技术保护点】
1.一种模糊非相关C均值聚类的茶叶红外光谱分类方法，其特征在于，包括如下步骤：步骤一、茶叶样本红外光谱采集及光谱预处理；步骤二、采用主成分分析方法对茶叶样本红外光谱进行降维处理和用线性判别分析提取茶叶训练样本红外光谱的鉴别信息；步骤三、设置模糊C‑均值聚类的权重指数m，最大迭代次数rmax，误差上限值ε。对步骤二的测试样本数进行模糊C均值聚类得到的聚类中心作为一种模糊非相关C均值聚类的初始聚类中心V(0)；步骤四：采用一种模糊非相关C均值聚类方法进行茶叶品种的判定。

【技术特征摘要】
1.一种模糊非相关C均值聚类的茶叶红外光谱分类方法，其特征在于，包括如下步骤：步骤一、茶叶样本红外光谱采集及光谱预处理；步骤二、采用主成分分析方法对茶叶样本红外光谱进行降维处理和用线性判别分析提取茶叶训练样本红外光谱的鉴别信息；步骤三、设置模糊C-均值聚类的权重指数m，最大迭代次数rmax，误差上限值ε。对步骤二的测试样本数进行模糊C均值聚类得到的聚类中心作为一种模糊非相关C均值聚类的初始聚类中心V(0)；步骤四：采用一种模糊非相关C均值聚类方法进行茶叶品种的判定。2.根据权利要求1所述的一种模糊非相关C均值聚类的茶叶红外光谱分类方法，其特征在于，所述步骤四的具体实现包括：1)初始化：设置权重指数m，类别数c，测试样本数n；设置迭代次数初始值r和最大迭代次数rmax；设置迭代的误差上限值为ε；2)计算模糊类间散射矩阵SfB其中，为第r次迭代时第k个样本xk隶属于第i类的模糊隶属度，m代表权重；c为类别数，为第r次迭代时第i类的类中心值，为测试样本的均值，n为测试样本数，xj为第j个测试样本，上标T代表矩阵转置运算；3)计算模糊总体散射矩阵SfT其中，xk为第k个测试样本；4)计算特征向量其中，为模糊离散度矩阵的逆矩阵，SfB为模糊类间散列矩阵，λ是特征向量ψ所对应的特征值。将计算所得的最大特征值λ1对应的特征向量ψ1作为模糊非相关鉴别转换向量的第1个向量，若p个模糊非相关鉴别转换向量为ψ1,ψ2,...,ψp，则计算第p+1个模糊非相关鉴别转换向量如下：5)将xk∈Rq转化到特征空间yk＝xkT[ψ1,ψ2,...,ψp](yk∈Rp)其中，p和q均为样本的维数，ψp为第p个特征向量，所述特征空间由ψ1,ψ2,...,ψp组成。6)同样将转化到特征空间其中，为步骤三中模糊C均值聚类中的类中心值，ψp为第p个特征向量；7)在特征空间中计算模糊隶属度函数值其中，yk为特征空间里第k个样本，是第r+1次迭代时样本yk隶属于类别i的模糊隶属度值，uik(r+1)是第r+1次迭代计算的模糊隶属度值；vi'(r)和vj'(r)分别是第r次迭代计算的第i类和第j类的类中心值；c为类别数，m为权重值；8)在特征空间中计算i类的类中心值其中，是第r+1次迭代计算的第i类的类中心的值。9)增加迭代数r值...

【专利技术属性】
技术研发人员：武小红，傅海军，陈勇，武斌，孙俊，戴春霞，翟艳丽，
申请(专利权)人：江苏大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人