当前位置: 首页 > 专利查询>江苏大学专利>正文

无监督可能模糊学习矢量量化的生菜品种光谱鉴别方法技术

技术编号:11360283 阅读:64 留言:0更新日期:2015-04-29 11:07
本发明专利技术公开一种无监督可能模糊学习矢量量化的生菜品种光谱鉴别方法,首先用光谱仪采集生菜样本的光谱,然后优选生菜光谱的波段,再用主成分分析方法对生菜的光谱进行降维处理,对降维后的生菜光谱数据运行模糊C-均值聚类,最后用无监督可能模糊学习矢量量化方法对生菜品种进行鉴别;无需学习样本,能对含有噪声信息的生菜光谱数据进行快速和无破坏性的检测,去除光谱中的冗余信息,加快处理速度和提高鉴别的准确率。

【技术实现步骤摘要】
无监督可能模糊学习矢量量化的生菜品种光谱鉴别方法
本专利技术涉及一种生菜品种鉴别方法,具体涉及无监督可能模糊学习矢量量化和光谱检测技术的生菜品种鉴别方法。
技术介绍
生菜是人们经常食用的主要蔬菜之一,生菜中含有丰富的营养成分,它含有丰富的膳食纤维和维生素等。不同品种的生菜则其外部品质和内部品质都是不相同的,如何选择产量高、品质高的生菜品种是农业科技工作者研究的重要课题,所以研究一种简单、快速、非破坏的生菜品种鉴别方法是非常必要的。光谱检测技术是研究光与物质分子之间相互作用的吸收光谱,是鉴定化合物和分析有机物结构的有效工具。光谱检测技术具有非破坏性检测、检测速度快、可同时检测多种成分等优点,广泛应用于农产品(包括谷物、饲料、水果、蔬菜等)成份的快速检测中。光谱射向生菜后得到漫反射光谱,在不同品种的生菜上获得的漫反射光谱是不同的,利用这个原理,可以实现生菜品种的鉴别。但是光谱检测存在的问题是:光谱仪器采集的原始光谱中除了包含与样品组成有关的信息外,也包含了来自各方面的因素所产生的噪声信号。这些噪声信号会对谱图信息产生干扰,有些情况下还很严重,从而影响样本数据模型的建立和对未知样品组成或性质的预测。模糊学习矢量量化(参见TsaoEC,BezdekJC,PalNR.FuzzyKohonenclusteringnetworks.PatternRecognition,1994,27(5):757–764.)是建立在模糊C-均值聚类(FCM)和Kohonen聚类网络基础上的聚类方法。模糊学习矢量量化利用模糊C-均值聚类的隶属度作为学习网络的学习速率。但是FCM建立在可能性约束条件(即同一个样本对所有类别的隶属度之和为1)基础上,对噪声数据敏感,影响聚类结果(参见KrishnapuramR,KellerJ.Apossibilisticapproachtoclustering.IEEETrans.FuzzySystems,1993,1(2):98-110.)。模糊学习矢量量化(FLVQ)建立在FCM基础上,其得到的隶属度值也要满足可能性约束条件,所以模糊学习矢量量化对噪声数据敏感(参见XiaohongWu,HaijunFu,BinWu,JiewenZhao.Possibilisticfuzzylearningvectorquantization,JournalofInformationandComputationalScience,2010,7(3):777-783)。噪声数据会影响模糊学习矢量量化的隶属度值从而影响聚类准确率。目前,在应用光谱检测技术进行果蔬品种鉴别时所采用的主要鉴别方法有:偏最小二乘判别分析(PLSDA)、软独立模式分类(SIMCA)、人工神经网络(ANN),支持向量机(SVM)、K-近邻法(KNN)等。这些鉴别方法属于有监督的模式识别方法,需要提供训练样本集供分类器学习,学习后再对测试集样本进行分类。在没有学习样本,或者学习样本比较少的情况下运用以上方法难以实现生菜品种的正确鉴别。
技术实现思路
本专利技术为了解决由于光谱所含的噪声数据对聚类准确率的影响,以及无学习样本或学习样本较少情况下的生菜品种鉴别问题,提出一种基于无监督可能模糊学习矢量量化和光谱检测技术的生菜品种鉴别方法,属于无监督学习方法,不需要学习样本,能快速、无损地鉴别生菜品种。本专利技术采用的技术方案是包括以下步骤:1)在恒温恒湿环境下用光谱仪采集不同品种的生菜样本的漫反射光谱;2)根据生菜品种之间的内部成份差异对漫反射光谱进行波段优选;3)采用主成分分析方法对优选后的生菜样本光谱进行降维处理,将生菜样本光谱从高维数据变换为低维数据;4)对降维后的生菜光谱数据运行模糊C-均值聚类,得到初始聚类中心;5)计算生菜光谱样本的协方差,根据初始聚类中心和协方差计算生菜光谱样本的第r次迭代时的模糊隶属度值、第r次迭代时的典型值;i=1,2,……,c,j=1,2,……,n,c是生菜光谱样本类别数,n是生菜光谱样本数;6)第r次迭代结束时,根据第j个样本中模糊隶属度的最大值所对应的i值,即判定第j个样本属于第i类;根据第j个样本中典型值的最大值所对应的i值,即判定第j个样本属于第i类,实现不同品种的生菜鉴别。进一步的方案是:协方差,为第k个生菜光谱样本,为样本的均值,,k=1,2,……,n;模糊隶属度值,为第j个生菜光谱样本,r=1,2,……,-1,j=1,2,……,n,为第r-1次迭代时第i类的聚类中心,为第r-1次迭代计算时第k类的聚类中心,为第r次迭代时的权重指数;典型值,为第r次迭代时的权重指数。与现有技术相比,本专利技术采用上述技术方案具有的优点是:1、本专利技术采用光谱检测技术检测生菜,能快速和无破坏性的对生菜进行检测。2、本专利技术采用无监督可能模糊聚类更新聚类网络的学习速率,能对含有噪声信息的生菜光谱数据进行准确聚类。3、本专利技术采用无监督可能模糊学习矢量量化方法,无需学习样本,可以在无学习样本情况下进行生菜品种鉴别,可实现不同品种生菜的鉴别。4、本专利技术采用了波段优选,能去除光谱中的冗余信息,加快处理速度和提高鉴别的准确率。附图说明图1是本专利技术的流程图;图2是实施例中生菜样本的漫反射光谱图。具体实施方式参见图1,本专利技术首先用光谱仪采集生菜样本的光谱,然后优选生菜光谱的波段,再用主成分分析方法对生菜的光谱进行降维处理,对降维后的生菜光谱数据运行模糊C-均值聚类,最后用无监督可能模糊学习矢量量化方法对生菜品种进行鉴别。具体如下:采集不同品种的生菜样本,在恒温恒湿环境下,用光谱仪采集不同品种的生菜样本的漫反射光谱。漫反射光谱是指光谱范围为350~2500nm,采集到的每个生菜样本的光谱是2151维的数据。对漫反射光谱进行波段优选。根据生菜品种之间的内部成份差异选择漫反射光谱的波段。从光谱范围为350~2500nm中选择出体现不同品种生菜差异的光谱波段,具体为:(1)选择的波段是400~660nm,该波段包含了生菜维生素含量的信息;(2)选择的波段是800~1320nm,该波段是生菜营养成分(如膳食纤维,碳水化合物和蛋白质等)的C-H和N-H基团的三倍频区域。(3)选择的波段1500~1820nm,该波段是生菜营养成分的C-H和N-H基团的二倍频区域。不同品种的生菜它们的维生素含量和营养成分是不同的,所以本专利技术选择的波段光谱体现出生菜品种之间的维生素含量和营养成分的差别信息。对优选后的生菜样本光谱进行降维处理:采用主成分分析方法(PCA)将生菜样本光谱从高维数据变换为低维数据。对降维后的生菜光谱数据运行模糊C-均值聚类,得到聚类中心。模糊C-均值聚类的参数设置为:类别数为3,权重指数为2,最大迭代数为100次,误差上限为0.00001。模糊C-均值聚类迭代终止后得到的聚类中心作为无监督可能模糊学习矢量量化方法的初始聚类中心。用无监督可能模糊学习矢量量化方法进行生菜品种的鉴别。具体是:1.初始化(1)固定生菜光谱样本类别数(),初始权重指数()和(),最大迭代数,r=1,误差上限的值,固定参数a()、b()和样本数n,;得到的初始聚类中心(i=1,2,……,c)。(2)计算生菜光谱样本的协方差,这里为第k个生菜光谱样本,为样本的均值,,k=1,2,……,n本文档来自技高网
...
无监督可能模糊学习矢量量化的生菜品种光谱鉴别方法

【技术保护点】
一种无监督可能模糊学习矢量量化的生菜品种光谱鉴别方法,其特征是包括如下步骤:1)在恒温恒湿环境下用光谱仪采集不同品种的生菜样本的漫反射光谱;2)根据生菜品种之间的内部成份差异对漫反射光谱进行波段优选;3)采用主成分分析方法对优选后的生菜样本光谱进行降维处理,将生菜样本光谱从高维数据变换为低维数据;4)对降维后的生菜光谱数据运行模糊C‑均值聚类,得到初始聚类中心;5)计算生菜光谱样本的协方差,根据初始聚类中心和协方差计算生菜光谱样本的第r次迭代时的模糊隶属度值、第r次迭代时的典型值;i=1,2,……,c,j=1,2,……,n,c是生菜光谱样本类别数,n是生菜光谱样本数;6)第r次迭代结束时,根据第j个样本中模糊隶属度的最大值所对应的i值,即判定第j个样本属于第i类;根据第j个样本中典型值的最大值所对应的i值,即判定第j个样本属于第i类,实现不同品种的生菜鉴别。

【技术特征摘要】
1.一种无监督可能模糊学习矢量量化的生菜品种光谱鉴别方法,包括如下步骤:1)在恒温恒湿环境下用光谱仪采集不同品种的生菜样本的漫反射光谱;2)根据生菜品种之间的内部成份差异对漫反射光谱进行波段优选;3)采用主成分分析方法对优选后的生菜样本光谱进行降维处理,将生菜样本光谱从高维数据变换为低维数据;4)对降维后的生菜光谱数据运行模糊C-均值聚类,得到初始聚类中心;5)计算生菜光谱样本的协方差,根据初始聚类中心和协方差计算生菜光谱样本的第r次迭代时的模糊隶属度值、第r次迭代时的典型值;i=1,2,……,c,j=1,2,……,n,c是生菜光谱样本类别数,n是生菜光谱样本数;协方差,为第k个生菜光谱样本,为样本的均值,,k=1,2,……,n;模糊隶属度值,为第j个生菜光谱样本,r=1,2,……,-1,j=1,2,……,n,为第r-1次迭代时第i类的聚类中心,为第r-1次迭代计算时第k类的聚类中心,为第r次迭代时的权重指数;典型值,为第r次迭代时的...

【专利技术属性】
技术研发人员:武小红武斌孙俊蔡培强嵇港
申请(专利权)人:江苏大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1