一种基于白酒基酒指纹图谱特征的分类方法技术

技术编号:20426371 阅读:28 留言:0更新日期:2019-02-23 08:54
本发明专利技术提出了一种基酒指纹图谱特征的分类方法,本发明专利技术涉及食品领域、发酵领域、信息处理以及模式识别等相关领域。本发明专利技术的白酒基酒指纹图谱分类方法结合主成分分析和神经网络的方法对基酒指纹图谱进行分类。本发明专利技术首先通过主成分分析对基酒的“重要成分”进行筛选,然后将筛选后的“重要特征”用来进行神经网络权重训练,最后用真实的基酒图谱数据进行测试,实现对基酒进行分类。本发明专利技术能够较好地克服白酒基酒中图谱中冗余数据“不重要的”组分对分类结果的影响,大大减少了神经网络的输入量和分类的计算量,分类的结果更能体现了基酒的特征上的差异。

【技术实现步骤摘要】
一种基于白酒基酒指纹图谱特征的分类方法
本专利技术涉及信息与数据处理以及模式识别与分类等相关领域,尤其涉及一种基于白酒基酒指纹图谱特征的分类方法。
技术介绍
白酒基酒的指纹图谱犹如人的指纹一样独一无二,能够展示出不同物质鲜明的特异性和典型性。利用基酒的指纹图谱来对基酒进行分析,是一种比较常规的综合评价方法。它具有采样精度高,特征明显、专属性强、重现性好、快速且识别能力强等特点。白酒的某些独有的特性(如:香型、产地等)决定了同种香型、相同产地的白酒所具有某种整体的相似性,决定了指纹图谱在白酒分类研究上的适用性和广泛性。白酒是多种化学成分的混合物,该混合物除98%的水和乙醇外,还包括约占2%的醇类、酯类、酸类、氨基酸类、醚类、醛类等微量成分。随着科学技术的进步以及各种检测方法的应用,目前已经发现决定着白酒的香味风格的微量成分约300余种,且其中有180余种已被定量分析出。在这些微量成分是构成白酒基酒典型特征的物质基础;微量成分在酒体中的含量和配比决定了白酒的香型、口感和质量。传统的白酒品评方法主要在感官评价,即视觉、嗅觉、味觉,对产品的色、香、味进行观察、分析、描述、定级,辅以理化分析,并做出综合评价。由于感官鉴评易受人为因素的影响,所以单凭感官对白酒基酒进行质量等级的划分,存在很多不确定的元素。由于感官分辨精度有限、操作规范不一致、人为等操作因素,使得白酒品质难以区分,等级难以界定。因此,需要客观评价机制对白酒指纹图谱进行分析。客观评价主要是对白酒的指纹图谱运用数学方法实现对白酒的分析、判断及分类识别等。白酒的指纹图谱是指通过色谱或光谱等技术手段获得能够表示白酒特性的图谱或图像,包括气相色谱法、近红外方法、核磁共振等方法。白酒图谱可以视为一个由白酒特征为元素组成的n维向量,通过对白酒图谱特征的提取,可以对白酒的品质特性进行分类与识别。在对白酒指纹图谱进行客观评价时,我们期望对白酒的组成成分进行分析,从而分析出各个成分对白酒按照香型、等级、产地以及年代等特征进行分类。这就需要利用模式识别方法对白酒所含化学成分用数学手段进行分类或描述,其主要运用的方法如:回归分析、聚类分析、判别分析、相关分析、主成分分析等多元统计方法及用于非线性体系的人工神经网络技术等在白酒质量控制中得到较好的应用。特别是针对神经网络技术而言,只要将白酒的化学成分作为输出,便可以针对这些化学成分数据进行训练,从而可以确定各个化学成分对白酒基酒分类的贡献。但是,随着监测技术的不断进步,白酒的很多微量成分被测定出来,如果将所有的微量成分都用来进行神经网络权重训练,需要更多的输入单元和训练时间。同时,对于同一种香型、等级的酒样,其某些微量成分的含量差异也较大,着就会导致训练的权重不准确,从而导致最终识别分类不准确。目前,指纹图谱研究较多,但很难成为比较准确的质量控制标准,尚有些问题需要解决,白酒基酒指纹图谱分类的研究难点集中在以下几个方面:1.如何获得良好的白酒指纹图谱。关键之一是选择性能优良的气相色谱仪,高分离效能的色谱柱,使其满足白酒香气组分全分析要求。2.如何更好地对指纹图谱进行分析。现有技术下,需要对图谱识别分类方法不断地进行改进优化,使对白酒图谱的分类更加具有合理性、科学性。3.如何把指纹图谱的信息与白酒的人工感官品评结合起来。白酒作为一种食品,只有同人的感官评价相结合,才能更全面地了解不同种类白酒的香味特征。4.如何提取出白酒基酒指纹图谱的重要特征,并用重要的特征进行神经网络训练出各个主要特征的权重参数,减少无效的组分对基酒的香型、年代以及产地等因素对训练数据的影响,使之适用于基酒的分类。
技术实现思路
本专利技术通过PCA对白酒基酒的各个图谱数据成分进行分析,提取的主要特征图谱(组成部分),利用BP神经网络对提取的主要特征图谱进行训练,分配出各个主要特征的权重,然后对新的基酒图谱进行分类,计算出的分类能更好地体现白酒基酒图谱的特性。本专利技术采用如下技术方案:步骤1.利用PCA获取白酒的主成分与贡献率(如:色谱仪设备采集得到的数据,经过白酒组分分析,得到n组基酒数据,每一组样本含有p个组分)设白酒基酒图谱为由p个组分组成的向量:如果用表示第i个样本的第j个图谱数据(组分),则n组白酒基酒样品的数据组成矩阵:在该矩阵中,每一个组分的数据标度相差很大(与)。为了消除由数据标度引起的权重计算差异,需要对图谱矩阵进行归一化处理。归一化后的白酒图谱向量为:数据矩阵X的协方差矩阵:矩阵中:求出矩阵S的特征值λi及相应的正交化单位特征向量ai=(ai,1,ai,2,ai,3,…,a1,p)T,特征值由大到小排列λ1≥λ2≥...≥λm>0,由特征向量组成的单位特征向量矩阵为:λi对应的单位特征向量ai就是主成分Fi的关于原变量的系数,则主成分Fi表示为:主成分Fi的贡献率可以通过特征值来反应信息量的贡献率大小,贡献率αi为:由于λ1≥λ2≥...≥λm则,Fi的贡献率大小关系为α1>α2>…>αm;前几个主成分代表白酒的绝大部分信息,前q个主成分累积贡献率G(q)表示为:当累积贡献率大于85%时,认为能够反应原来变量的信息,对应的q就是抽取的前q个主成分。步骤2.利用PCA对白酒图谱主要特征进行筛选对成分参数的数据矩阵X进行主成分分析,求出主成分F1,F2,…,Fm,贡献率最小的主成分Fm,Fm可以由白酒成分的表达式线性表示:Fm=am1x1+am2x2+...+ampxp式中,am1,am2,...,amp为Fm的特征向量系数,找到该特征向量系数最大的系数am,g(g取值1~p之间的某一个值),am,g对应的白酒成分xg,xg可以理解为在这些成分中对白酒特性最不重要的成分。删除n个白酒样品中每个样品中的成分xg,则每个白酒样品图谱数据剩余p-1。对剩余p-1图谱数据的n个样品重复上述操作,每次重复删除一个最不重要的成分,直到每个样品的剩余的图谱成分数据个数为预先设定的值h为止。步骤3.基于BP神经网络的白酒基酒图谱分类将步骤2筛选出来的主要特征,用来作为BP的输入数量,训练出各个主要特征的权重参数,采用BP神经网络对白酒图谱进行分类。因此,神经网络结构,采用n个输出神经元(n类),在实验过程中,隐藏层神经元对训练结果影响不大。因此,采用10个隐藏层神经元,隐藏层使用Sigmoid传输函数,输出层采用线性传输函数。BP神经网络被成功的应用在数据的预测与分类上。典型的神经网络由输入层,隐藏层和输出层三部分组成,通常一个神经网络的隐藏层可以由多个隐藏层神经元组成,其中:输入层称为第一层,输出层被称为最后一层,其它各隐藏层分别进行编号。对于典型的三层神经网络结构而言,假设输入向量为:X=[x1,x2,...,xm],输出层为:Y=[y1,y2,...,yn],隐藏层为:H=[h1,h2,...,hs]其中,m,s,n分别对应输入层、输出层和隐藏层的神经元个数。设Wij为输出层第j个神经元到隐藏层第i个神经元之间的连接权重,bi为隐藏层第i个神经元的偏置,那么:hil=f(netil)其中,netil为第l层第i个神经元的输入,f为神经元的激活函数。在本BP神经网络中,选用下面的Sigmod非线性激活函数:第一种成为Sigmod函数,第二种为双曲正切函数本文档来自技高网
...

【技术保护点】
1.一种基于白酒基酒指纹图谱特征的分类方法,其特征在于,包括以下步骤:S1.获取n组基酒图谱数据获取n组白酒基酒样品的数据,设定其具有P个组分组成的白酒样本数据x=(x1,x2,...,xp);S2.对白酒成分进行归一化处理用

【技术特征摘要】
1.一种基于白酒基酒指纹图谱特征的分类方法,其特征在于,包括以下步骤:S1.获取n组基酒图谱数据获取n组白酒基酒样品的数据,设定其具有P个组分组成的白酒样本数据x=(x1,x2,...,xp);S2.对白酒成分进行归一化处理用表示第i个样本的第j个图谱数据,则n组白酒基酒样品的数据组成矩阵为求出每列的均值uj与标准差σj,j取值范围1≤j≤p,在上式矩阵中,每一个组分的数据标度相差很大,为消除由数据标度引起的权重计算差异,需要对图谱矩阵进行归一化处理,采用如下公式对上式矩阵的每一个元素进行标准化:其中,uj与σj分别为的第j列的均值和标准差,于是,得到归一化的矩阵为X:数据矩阵X的协方差矩阵:矩阵中:求出矩阵S的特征值λi及相应的正交化单位特征向量ai=(ai,1,ai,2,ai,3,…,a1,p)T,特征值由大到小排列λ1≥λ2≥...≥λm>0,由特征向量组成的单位特征向量矩阵为:λi对应的单位特征向量ai是主成分Fi的关于原变量的系数,主成分Fi表示为:主成分Fi的贡献率通过特征值来反映信息量的贡献率大小,贡献率αi为:由于λ1≥λ2≥...≥λm则,Fi的贡献率大小关系为α1>α2>…>αm;前几个主成分代表白酒的绝大部分信息,前q个主成分累计贡献率G(q)表示为:当累积贡献率大于85%时,认为能够足够反映原来变量的信息,对应q是抽取的前q个主成分;S3.PCA筛选基酒主要特征对成分参数的数据矩阵X进行主成分分析,求出主成分F1,F2,…,Fm,贡献率最小的主成分为Fm,Fm由白酒成分的表达式线性表示:Fm=am1x1+am2x2+...+ampxp式中,am1,am2,...,amp为Fm的...

【专利技术属性】
技术研发人员:黄臣程熊兴中陈明举赵金松谭文渊
申请(专利权)人:四川理工学院
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1