一种基于白酒特性的图谱相似度计算方法技术

技术编号:17597816 阅读:65 留言:0更新日期:2018-03-31 10:46
一种基于白酒特性的图谱相似度计算方法,通过归一化预处理消除白酒样品图谱数据标度相差大而引起的权重差异,再通过主成分分析筛选出对白酒特性贡献率大的图谱数据,根据图谱数据的贡献率大小确定其参与相似度计算时的权值。在计算同一类型的两种白酒图谱的相似度时,只需选用筛选出的图谱数据,将相应的权值带入相似度公式中便可求得相似度值。采用本发明专利技术所述方法得到的相似度值能消除贡献率低或不相关的图谱数据对相似度值的不利影响,充分考虑到不同特征成分对白酒特性的贡献率的不同,能够更准确地体现白酒特性的相似程度,对白酒的客观评价更为准确。

A method for calculating similarity of atlas based on the characteristics of liquor

A calculation method of similarity based on the characteristics of the liquor, the liquor sample data of the scale difference caused by the difference of weight through the normalization pretreatment to eliminate, and then through the principal component analysis selected contributions to the characteristics of data of large liquor rate, according to the data of the contribution rate of the size of their participation in calculating the similarity weights. When calculating the similarity of two types of liquor map, we only need to select the selected map data, and we can bring the corresponding weights into the similarity formula, then we can get the similarity value. The similarity is obtained by using the method of the invention can eliminate the value of the contribution rate is low or not related to the data of adverse effects on the similarity value, considering the contribution of different characteristic components of liquor characteristics of different rates to more accurately reflect the degree of similarity of liquor characteristics, the objective evaluation of the liquor is more accurate.

【技术实现步骤摘要】
一种基于白酒特性的图谱相似度计算方法
本专利技术涉及图像处理
,尤其涉及一种监控视频异常事件的检测方法。
技术介绍
白酒在酿造过程中所用的原材料、曲类、酒母和环境不尽相同,即使同一批的酒也可能会在风味形成上产生较大的差异。目前,我国已经确定形成的白酒香型多达十余种,如浓香型、酱香型、清香型、米香型、芝麻香型、凤香型、药香型、特香型等等。白酒是多种化学成分的混合物,除98%的水和乙醇外,还包括:醇类、酯类、酸类、氨基酸类、醚类、醛类等微量成分。微量成分约占2%,但种类很多,随着科学技术的进步,现已发现决定着白酒的香味风格的微量成分约300余种,其中有180余种已被定量分析出。微量成分是构成白酒典型特征的物质基础,微量成分在酒体中的含量和配比决定了白酒的香型、口感和质量。白酒品质的主观评价主要是品酒师运用视觉、嗅觉、味觉等感觉器官对白酒的色、香、味进行观察、分析、描述做出综合评价。由于感官分辨精度有限、操作规范不一致、人为等操作因素,使得白酒品质难以区分,等级难以界定。客观评价主要对白酒的指纹图谱运用数学处理的方法实现对白酒的分析、判断及识别等。白酒的指纹图谱是指通过色谱或光谱等技术手段获得能够表示白酒特性的图谱或图像,包括气相色谱法、液相色谱法、气质联用、红外光谱法、电子鼻等方法。白酒图谱可以视为一个由白酒特征为元素组成的n维向量,图谱的相似度可以将白酒的特性以客观的数字表示出来,较好地反应两张指纹图谱的相似程度。目前常见的相似度计算方法包括相关系数法、夹角余弦法、欧氏距离法等。这些相似度计算方法把图谱中的所有的成分看着同等重要,所有成分等权值参与计算得到相似度。然而,不同微量成分对白酒的香味贡献大小不同,不同香型、不同酒龄与不同品种的白酒在微量成分的构成上存在一定的差异。例如,己酸乙酯、丁酸乙酯和乳酸乙酯等酯类物质在白酒香味成分中起主导作用,决定白酒的主要特征,醇类与醛类物质分别为白酒的助香成分与放香成分,他们对白酒特征贡献较低。浓香型白酒的主体香成分是己酸乙酯,清香型白酒的主体香成分是乙酸乙酯。采用上述方法对白酒的相似度进行计算,决定白酒品质的主要特征成分与其它成分(贡献率低或不相关的成分)等强度对待,势必会影响相似度的数值。另一方面,不同的主要特征成分对白酒品质的贡献大小也不同。因此,将所有成分等权值参与计算得到的相似度不能有效地反映白酒特性方面的差异。
技术实现思路
本专利技术的目的在于解决上述现有技术存在的缺陷,提供一种更加准确的白酒图谱相似度计算方法。为实现上述专利技术目的,本专利技术所采用的技术方案是:一种基于白酒特性的图谱相似度计算方法,包括以下步骤:(1)选取同类白酒的n个不同样本,对n个样本分别选取p个共有图谱数据;所述图谱数据是指白酒成分的含量数据;(2)对所述p个图谱数据进行归一化处理,得到由所述n个样本的p个归一化后的图谱数据组成的数据矩阵(3)对所述图谱数据矩阵X进行主成分分析,筛选出对白酒特性贡献率大的h个图谱数据,h为整数且1≤h≤P;(4)对由n个样本的所述h个图谱数据组成的数据矩阵进行主成分分析,得到所述h个图谱数据中每个图谱数据的权值;(5)通过筛选的h个图谱数据及相应的权值获取两个白酒样品的相似度。优选的,所述步骤(2)包括以下步骤:a.对所述p个共有图谱数据进行归一化处理,得到每个样本的图谱数据向量xi=(xi,1,xi,2,xi,3,…,xi,p),其中1≤i≤n,元素xi,p为第i个样本第p个归一化后的图谱数据;b.n个样本的上述图谱数据向量组成数据矩阵其中,xn,p表示第n个白酒样本的第p个归一化后的图谱数据。优选的,所述步骤(3)包括以下步骤:c.对所述数据矩阵X进行主成分分析,得到矩阵X的协方差矩阵其中元素xk,i、xk,j分别是第k个样品的第i和j个图谱数据,分别是n个样品的第i和j个图谱数据的平均值,1≤k≤n,1≤i≤P,1≤j≤P,求出矩阵S的特征值λ并将其由大到小排列,设定阈值T,找到特征值λm,使λm≥T,λm+1<T,λm对应的正交化单位特征向量am=(am,1,…,am,g,…,am,p),λm对应的主成分Fm通过白酒图谱数据的表达式为Fm=am,1x1+…+am,gxg+…+am,pxp,其中am,1,…,am,g,…,am,p为Fm的特征向量系数;d.找到上述主成分Fm中绝对值最大的特征向量系数am,g对应的图谱数据xg,删除n个白酒样本中每个样本的图谱数据xg,则每个白酒样本剩余p-1个图谱数据;e.对剩余p-1个图谱数据的n个样本重复上述步骤,每次删除一个绝对值最大的特征向量系数对应的图谱数据,至每个样本剩余预设的h个图谱数据为止。优选的,所述步骤(4)包括以下步骤:f.以筛选的h个图谱数据组成每个白酒样本的图谱数据向量yi=(yi,1,yi,2,yi,3,…,yi,h),1≤i≤n,以n个样本的上述图谱数据向量组成数据矩阵Y;g.对上述矩阵Y进行主成分分析,取前k个主成分,使其累计贡献率G(k)≥85%、G(k-1)<85%,计算k个主成分中每个主成分的贡献率αi,得到由k个主成分与含h个图谱数据的图谱关系矩阵其中,所述累计贡献率G(k)由计算,所述贡献率αi由计算;h.筛选的h个图谱数据的贡献值组成的向量b=(b1,…,bt,…bh),式中bt为第t个图谱数据的贡献值,1≤t≤h,bt=|α1a1,t|+|α2a2,t|+…+|αkak,t|;i.对向量b进行归一化得到归一化的贡献率系数向量c=(c1,…,ct,…ch),1≤t≤h,式中元素ct=bt/sum(b),为第t个图谱数据的归一化贡献率系数,也即相似度计算时第t个图谱数据的权值。优选的,所述步骤(5)包括以下步骤:j.选取两个与上述n个白酒样本同品种的样品酒的h个图谱数据并归一化处理分别得到相应的图谱数据向量y1=(y1,1,…,y1,t,…,y1,h)与y2=(y2,1,…,y2,t,…,y2,h),1≤t≤h,按以下公式计算两个样品酒的图谱特性相似度值SIM,根据SIM值的大小确定两个样品酒特性的相似度高低。优选的,所述步骤c中的阈值T=0.1。优选的,所述步骤e中预设的剩余图谱数据数目h根据所选取的不同类型成分的图谱数据的数目确定。优选的,所述预设的剩余图谱数据数目h按下式确定,h=0.8×A+0.5×B+0.4×C+0.1×D,其中A、B、C、D分别为选取的p个共有图谱数据中醇类成分、醛类与酯类成分、酸类成分以及其它成分的图谱数据的数目,p=A+B+C+D。本专利技术通过归一化预处理能够消除白酒样品图谱数据标度相差大而引起的权重差异,通过主成分分析去除白酒图谱数据中对白酒特性贡献率低或不相关的图谱数据,筛选出对白酒特性贡献率大的图谱数据参与相似度计算,以此消除贡献率低或不相关的图谱数据对相似度值的影响。再通过主成分分析计算出各图谱数据对白酒特性的贡献率大小,进而确定了参与相似度计算的各个白酒图谱数据的权值,从而使得到的相似度值能够体现出不同特征成分对白酒特性的贡献率大小。采用本专利技术所述方法计算出的相似度值能更准确地体现白酒特性的相似程度,对白酒的客观评价更为准确,具有极大的应用价值。附图说明图1.基于白酒特性的图谱相似度计算的流程图;图2.两个同类样品酒的基于本文档来自技高网
...
一种基于白酒特性的图谱相似度计算方法

【技术保护点】
一种基于白酒特性的图谱相似度计算方法,其特征在于,包括以下步骤:(1)选取同类白酒的n个不同样本,对n个样本分别选取p个共有图谱数据;所述图谱数据是指白酒成分的含量数据;(2)对所述p个图谱数据进行归一化处理,得到由所述n个样本的p个归一化后的图谱数据组成的数据矩阵

【技术特征摘要】
1.一种基于白酒特性的图谱相似度计算方法,其特征在于,包括以下步骤:(1)选取同类白酒的n个不同样本,对n个样本分别选取p个共有图谱数据;所述图谱数据是指白酒成分的含量数据;(2)对所述p个图谱数据进行归一化处理,得到由所述n个样本的p个归一化后的图谱数据组成的数据矩阵(3)对所述图谱数据矩阵X进行主成分分析,筛选出对白酒特性贡献率大的h个图谱数据,h为整数且1≤h≤P;(4)对由n个样本的所述h个图谱数据组成的数据矩阵进行主成分分析,得到所述h个图谱数据中每个图谱数据的权值;(5)通过筛选的h个图谱数据及相应的权值获取两个白酒样品的相似度。2.根据权利要求1所述的基于白酒特性的图谱相似度计算方法,其特征在于,所述步骤(2)包括以下步骤:a.对所述p个共有图谱数据进行归一化处理,得到每个样本的图谱数据向量xi=(xi,1,xi,2,xi,3,…,xi,p),其中1≤i≤n,元素xi,p为第i个样本第p个归一化后的图谱数据;b.n个样本的上述图谱数据向量组成数据矩阵其中,xn,p表示第n个白酒样本的第p个归一化后的图谱数据。3.根据权利要求1所述的基于白酒特性的图谱相似度计算方法,其特征在于,所述步骤(3)包括以下步骤:c.对所述数据矩阵X进行主成分分析,得到矩阵X的协方差矩阵其中元素xk,i、xk,j分别是第k个样品的第i和j个图谱数据,分别是n个样品的第i和j个图谱数据的平均值,1≤k≤n,1≤i≤P,1≤j≤P,求出矩阵S的特征值λ并将其由大到小排列,设定阈值T,找到特征值λm,使λm≥T,λm+1<T,λm对应的正交化单位特征向量am=(am,1,…,am,g,…,am,p),λm对应的主成分Fm通过白酒图谱数据的表达式为Fm=am,1x1+…+am,gxg+…+am,pxp,其中am,1,…,am,g,…,am,p为Fm的特征向量系数;d.找到上述主成分Fm中绝对值最大的特征向量系数am,g对应的图谱数据xg,删除n个白酒样本中每个样本的图谱数据xg,则每个白酒样本剩余p-1个图谱数据;e.对剩余p-1个图谱数据的n个样本重复上述步骤,每次...

【专利技术属性】
技术研发人员:陈明举熊兴中黄臣程林国军
申请(专利权)人:四川理工学院
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1