一种基于白酒指纹图谱特征的分类方法技术

技术编号:18668698 阅读:59 留言:0更新日期:2018-08-14 20:45
本发明专利技术提供一种基于白酒指纹图谱特征的分类方法,包括以下步骤:选取M个白酒样本,对M个样本分别选取N个共有指纹图谱数据;对所述N个图谱数据进行归一化处理,得到由所述M个样本的N个归一化后的图谱数据组成的数据矩阵X;利用误差分析计算矩阵X的误差矩阵E,设定阈值T,确定矩阵E中数值小于阈值T的非对角元素的数目,得到粗分类个数L;根据粗分类个数L对矩阵X进行非负矩阵分解,得到基矩阵W和系数矩阵H;对所述基矩阵W进行聚类,得到矩阵X的细分类结果;本发明专利技术所述分类方法能够消除无关图谱特征对白酒分类的影响,显著降低数据的维数,使对白酒的分类更加准确客观。

A classification method based on fingerprint characteristics of liquor

The invention provides a classification method based on the characteristics of liquor fingerprint, which comprises the following steps: selecting M liquor samples, selecting N common fingerprint data of M liquor samples, normalizing the N common fingerprint data, and obtaining a data moment composed of N normalized fingerprint data of the M liquor samples. Matrix X; use error analysis to calculate the error matrix E of matrix X, set the threshold T, determine the number of non-diagonal elements in matrix E whose value is less than the threshold T, get the rough classification number L; decompose the matrix X into non-negative matrix according to the rough classification number L, get the base matrix W and coefficient matrix H; cluster the base matrix W and get the rough classification number L. The classification method can eliminate the influence of irrelevant atlas characteristics on liquor classification, significantly reduce the dimension of data, and make liquor classification more accurate and objective.

【技术实现步骤摘要】
一种基于白酒指纹图谱特征的分类方法
本专利技术涉及白酒分类
,具体涉及一种基于白酒指纹图谱特征的分类方法。
技术介绍
指纹图谱是指某些复杂物质或某生物体的DNA、蛋白质等经适当处理后,采用一定的技术分析手段,获得的能够标示其化学特征的色谱图或光谱图。指纹图谱能够展示出不同物质鲜明的特异性和典型性。指纹图谱是一种综合的评价方法,它建立在研究样本复杂成分体系的基础上,具有采样精度高,特征明显、专属性强、重现性好的特点,且操作方便、快速且识别能力强。白酒独有的多香型、多产地特性决定了同种香型、相同产地的白酒所具有的整体相似性,决定了指纹图谱应用在白酒研究上的适用性和广泛性。白酒在酿造过程中由于原材料、酒曲、酒母、环境以及技术等因素的影响,使白酒在风味及口感上存在较大的差异。其表现具体为:不同生产厂商生产的白酒风味口感的不同;同一生产厂商内部酒的档次不同。由于不同厂、不同时间、批次中的白酒图谱存在差异,不同方式检测得到的图谱具有不同的特性。目前,我国已经形成了浓香型、酱香型、清香型等众多风味的酒类。白酒是多种化学成分的混合物,该混合物98%为水和乙醇,除此之外,还包括:醇类、酯类、酸类、氨基酸类、醚类、醛类等微量成分。微量成分约占2%,但种类很多,随着科学技术的进步,现已发现决定着白酒的香味风格的微量成分约300余种,其中有180余种已被定量分析出。在这些微量成分是构成白酒典型特征的物质基础;微量成分在酒体中的含量和配比决定了白酒的香型、口感和质量。传统的白酒品评方法本是在感官评价,即视觉、嗅觉、味觉,对产品的色、香、味进行观察、分析、描述、定级,辅以理化分析,并做出综合评价。由于感官鉴评易受人为因素的影响,所以单凭感官对白酒基酒进行质量等级的划分,存在很多不确定的元素。由于感官分辨精度有限、操作规范不一致、人为等操作因素,使得白酒品质难以区分,等级难以界定。因此,需要客观评价机制对白酒指纹图谱进行分析。客观评价主要是运用数学方法对白酒的指纹图谱进行分析、判断及分类识别等。白酒的指纹图谱是指通过色谱或光谱等技术手段获得能够表示白酒特性的谱图或图像,包括气相色谱法、近红外方法、核磁共振等方法。白酒图谱可以视为一个由白酒特征为元素组成的n维向量,通过对白酒图谱特征的提取,可以对白酒的品质特性进行分类与识别。模式识别是根据白酒所含化学成分用数学手段对其进行分类或描述,其中回归分析、聚类分析、判别分析、相关分析、主成分分析等多元统计方法及用于非线性体系的人工神经网络技术等在白酒质量控制中得到很好的应用。目前,指纹图谱研究较多,但真能够正成为比较准确的质量控制标准,尚有些问题需要解决,白酒指纹图谱分类的研究难点集中在以下几个方面。第一是如何获得良好的白酒指纹图谱。关键之一是选择性能优良的气相色谱仪,高分离效能的色谱柱,使其满足白酒香气组分全分析要求。第二是如何更好地对指纹图谱进行分析。在现有的技术下,需要对图谱识别分类方法、相似度计算方法以及图谱的计算机辅助分析方法等不断地进行改进优化,使图谱分析更加规范化、科学化。第三是如何把指纹图谱的信息与白酒的人工感官品评结合起来。白酒作为一种食品,只有同人的感官评价相结合,才能更全面地了解不同种类白酒的香味特征。
技术实现思路
本专利技术的目的在于解决上述现有技术中存在的缺陷,提供一种更加准确的基于指纹图谱特征的白酒分类方法。为实现上述专利技术目的,本专利技术所采用的技术方案是:一种基于白酒指纹图谱特征的分类方法,包括以下步骤:(1)选取M个白酒样本,对M个样本分别选取N个共有图谱数据;所述图谱数据为白酒成分的含量数据;(2)对所述N个图谱数据进行归一化处理,得到由所述M个样本的N个归一化后的图谱数据组成的数据矩阵其中,元素xi,j表示第i个样本第j个图谱数据,1≤i≤M,1≤j≤N;(3)利用误差分析计算所述数据矩阵X的误差矩阵其中,元素em,n表示第m个和第n个白酒样本数据之间的误差值,1≤m≤M,1≤n≤M;设定阈值T,确定所述矩阵E中数值小于阈值T的元素em,n的数目O,其中m≠n,粗分类个数L=M-O/2;(4)根据所述粗分类个数L对数据矩阵X进行非负矩阵分解,得到基矩阵WM×L和系数矩阵HL×N,其中,矩阵X与WM×LHL×N的差异函数处于最小值;(5)对所述基矩阵WM×L进行聚类,得到数据矩阵X的细分类结果。优选的,步骤(3)中所述误差分析为平均绝对误差分析或均方误差分析。优选的,所述平均绝对误差分析按下式进行,其中,em,n为误差矩阵E中的元素,xm,k、xn,k为数据矩阵X中的元素。优选的,所述均方误差分析按下式进行,其中,em,n为误差矩阵E中的元素,xm,k、xn,k为数据矩阵X中的元素。优选的,步骤(4)中所述差异函数为Euclidean距离、相对熵或K-L散度。优选的,当采用Euclidean距离作为差异函数时,所述差异函数优选的,步骤(5)中对所述基矩阵WM×L进行聚类的方法为K-均值聚类或谱聚类。优选的,采用K-均值聚类对所述基矩阵WM×L进行聚类时,准则函数为K为分类的数量,ck为相应的聚类中心。本专利技术所述分类方法通过归一化处理能够消除白酒样品图谱数据标度相差大而引起的权重分配差异,先通过误差分析对白酒指纹图谱数据进行粗分类,确定粗分类的个数,再根据粗分类的结果对白酒图谱数据进行非负矩阵分解,提取白酒图谱数据中的特征和相应的权重数据,最后通过聚类方法对分解后的数据矩阵进行细分类。本专利技术所述分类方法能够消除无关图谱特征对白酒分类的影响,显著降低数据的维数,使对白酒的分类更加准确客观,具有极大的应用价值。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。某型白酒基于指纹图谱特征的分类方法包括以下步骤:(1).白酒样本和指纹图谱数据的选取:选取该型白酒的20个样本,每个样本的成分图谱数据包括36个共有的白酒指纹图谱数据(mg/L),每个样本的图谱数据包括乙醛(z1)、甲酸乙酯(z2)、乙酸乙酯(z3)、乙缩醛(z4)、甲醇(z5)、叔戊醇(z6)、丁酸乙酯(z7)、仲丁醇(z8)、正丙醇(z9)、乙酸丁酯(z10)、异丁醇(z11)、乙酸异戊酯(z12)、戊酸乙酯(z13)、正丁醇(z14)、乙酸正戊酯(z15)、2-甲基丁醇(z16)、异戊醇(z17)、己酸乙酯(z18)、正戊醇(z19)、庚酸乙酯(z20)、乳酸乙酯(z21)、正己醇(z22)、辛酸乙酯(z23)、糠醛(z24)、乙酸(z25)、壬酸乙酯(z26)、丙酸(z27)、丁酸(z28)、异戊酸(z29)、戊酸(z30)、2-乙基丁酸(z31)、己酸(z32)、β-苯乙醇(z33)、庚酸(z34)、辛酸(z35)、十六酸乙酯(z36)。(2).对所述图谱数据进行归一化处理:对白酒成分图谱数据进行归一化处理以消除权重差异,具体方法是以每个白酒样本的36个图谱数据为一个行向量,20个样本组成的图谱数据矩阵Z为:求出矩阵Z中每列的最大值j取值范围1≤j≤36,采用如下公式对矩本文档来自技高网
...

【技术保护点】
1.一种基于白酒指纹图谱特征的分类方法,其特征在于,包括以下步骤:(1)选取M个白酒样本,对M个样本分别选取N个共有指纹图谱数据;所述指纹图谱数据为白酒成分的含量数据;(2)对所述N个图谱数据进行归一化处理,得到由所述M个样本的N个归一化后的图谱数据组成的数据矩阵

【技术特征摘要】
1.一种基于白酒指纹图谱特征的分类方法,其特征在于,包括以下步骤:(1)选取M个白酒样本,对M个样本分别选取N个共有指纹图谱数据;所述指纹图谱数据为白酒成分的含量数据;(2)对所述N个图谱数据进行归一化处理,得到由所述M个样本的N个归一化后的图谱数据组成的数据矩阵其中,元素xi,j表示第i个样本的第j个图谱数据,1≤i≤M,1≤j≤N;(3)利用误差分析计算所述数据矩阵X的误差矩阵其中,元素em,n表示第m个和第n个白酒样本数据之间的误差值,1≤m≤M,1≤n≤M;设定阈值T,确定所述矩阵E中数值小于阈值T的元素em,n的数目O,其中m≠n,粗分类个数L=M-O/2;(4)根据所述粗分类个数L对数据矩阵X进行非负矩阵分解,得到基矩阵WM×L和系数矩阵HL×N,其中,矩阵X与WM×LHL×N的差异函数处于最小值;(5)对所述基矩阵WM×L进行聚类,得到数据矩阵X的细分类结果。2.根据权利要求1所述的一种基于白酒指纹图谱特征的分类方法,其特征在于,步骤(3)中所述误差分析为平均绝对误差分析或均方误差分析。3.根据权...

【专利技术属性】
技术研发人员:黄臣程熊兴中陈明举赵金松谭文渊
申请(专利权)人:四川理工学院
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1