一种筛选红外光谱特征波长用于预测葡萄酒品质参数的方法技术

技术编号:23852547 阅读:49 留言:0更新日期:2020-04-18 09:24
一种筛选红外光谱特征波长用于预测葡萄酒品质参数的方法,精简模型的同时提高多元校正模型的预测能力,从而实现葡萄酒品质参数的快捷、较准确的测定。具体过程如下:采集已知品质参数的葡萄酒的傅里叶变换红外光谱数据,随机分为训练集和检验集。对训练集光谱进行Fisher判别分析,得到变量的特征矩阵E,其绝对值的平均值为

A method of selecting characteristic wavelength of infrared spectrum to predict wine quality parameters

【技术实现步骤摘要】
一种筛选红外光谱特征波长用于预测葡萄酒品质参数的方法
本专利技术属于分析化学领域的分析手段,具体涉及一种通过筛选红外光谱特征波长用于检测葡萄酒品质参数的方法。
技术介绍
中国是酒水消费大国,其中葡萄酒近年来不断得到大众的青睐,国产葡萄酒行业发展迅猛,而葡萄酒品质的鉴定非常重要。目前国内外传统的酒质量检测方法主要有气相色谱-质谱法、高效液相色谱法、气相色谱-质谱法、液相色谱-质谱法等。这些分析方法具备灵敏度高、检测限低等优势,但同时也存在不足,如检测时间长、样品的预处理方法复杂、无法同时检测乙醇、乳酸等多个质量参数。光谱分析技术在食品工业分析中发挥着重要的作用。傅里叶变换红外光谱(Fouriertransforminfrared,FT-IR)法是一种常用的分析方法,可以对复杂体系进行整体宏观鉴定,快捷、分辨率高。由于葡萄酒成分多样、谱峰重叠引起的谱图特征减弱;以及由于生产工艺和原料的不同,不同品牌葡萄酒组成差异较大,因此将化学计量学技术引入红外光谱以实现客观量化的解析。从大量的光谱数据中提取代表样本组分的特征信息尤为关键。光谱中存在的一些包含无用或无关信息的变量,诸如噪声、背景等,识别和去除这些无用的信息可以精简模型并提高多元校正模型的预测能力。因此,筛选红外光谱特征波长是建立稳健预测品质参数模型的关键。提出一种筛选红外光谱特征波长的方法-费舍判别波长筛选(FisherDiscriminantVariableSelection,FD-VS)。在FD-VS方法中,波长的特征矩阵(Eigenvector)作为波长(变量)选择的判据,特征矩阵中每个值反映其对应波长的重要性。特征矩阵的绝对值称为|E|,其值越大,对应的波长越为重要(关键),即为代表样本组分信息的特征波长。筛选出的特征波长用于建立预测模型,对红酒多个主要品质参数进行同时定量分析。
技术实现思路
本专利技术的目的是提供一种快速、简捷的筛选红外光谱特征波长用于同时定量预测多个红酒品质参数的方法。采集已知品质参数的葡萄酒样品的傅里叶变换红外光谱数据,随机分为训练集和检验集。将训练集的红外光谱数据进行Fisher判别分析,通过得到的特征矩阵En×1来衡量光谱中对应波长的重要性。第i个波长对应的特征矩阵值为Ei,特征矩阵E的绝对值的平均值为定义筛选阈值k,当时,相应的波长被保留下来用于构建光谱和多个葡萄酒品质参数的定量模型,从而实现对未知葡萄酒样本的品质参数的预测。为实现本专利技术所提供的具体步骤包括:1.数据采集:多个品牌的已知某些主要品质参数的葡萄酒,采用傅里叶变换红外光谱仪扫描其红外光谱数据Am×n(m个样本,n个变量);2.数据分组:将光谱数据随机分为训练集和检验集,比例为3∶1。训练集用来筛选特征波长和建立模型,检验集样本用来优化筛选过程参数;3.结合留一法交互验证原理,令训练集中每个样本作为类别1,其余样本作为类别2,经过Fisher判别分析(FDA)方法多次迭代分析后,得到光谱变量的特征矩阵En×1;4.令第i个波长对应的特征矩阵值为Ei,特征矩阵E的绝对值的平均值为定义筛选阈值k,当时,相应的波长变量被保留下来用于构建光谱和多个葡萄酒品质参数的定量最小二乘支持向量回归模型(LSSVR)模型;5.利用训练集构建的LSSVR模型预测检验集样品中的品质参数值,与检验集中样品的真实品质参数值相比,计算检验集中每个品质参数的均方根误差(RMSEV);6.调整筛选阈值k,重复步骤4-5,当检验集的RMSEV达到最小值且数值稳定时,对应的阈值k为最佳筛选阈值,此时筛选出的波长变量用于建立LSSVR模型,来定量预测未知葡萄酒样品(作预测集)中的相应品质参数。附图说明图1为实施例的葡萄酒样品的FT-IR光谱例图。图2为实施例的变量特征矩阵(Eigenvector)绝对值及筛选阈值(selectionthreshold)k示意图。图3为实施例的FD-VS-LSSVR筛选波长数目的优化图,给出了不同波长数目下的RMSEV和RMSEP。图中:(a)乙醇;(b)总酸;(c)pH;(d)乳酸;(e)密度;(f)总多酚指数;(g)丙三醇;(h)甲醇;(i)酒石酸。具体实施方式为了更好地理解本专利技术,结合实施例对本专利技术FD-VS-LSSVR方法做进一步地详细说明。实施例:1.数据采集:从http://www.models.life.ku.dk/Wine_GCMS_FTIR下载四十四个红酒的FT-IR光谱公开数据以及其中九个品质参数值,包括乙醇(vol.%)、总酸(g/L)、乳酸(g/L)、密度(g/mL)、pH、总多酚指数、丙三醇(g/L)、甲醇(vol.%)和酒石酸。光谱范围为929-5011cm-1,采样间隔4cm-1;其中水峰对应1545-1710cm-1和2968-3620cm-1的数据被剔除,剩余842个波长数据用于计算。2.数据分组:将样本随机分为训练集、检验集与预测集,其中训练集样本28个,检验集样本8个,预测集样本8个;3.结合留一法交互验证原理,令训练集中的每个样本作为类别1,其余样本作为类别2,经过Fisher判别多次迭代分析后,得到变量的特征矩阵E842×1;4.令第i个波长在特征矩阵中对应的特征矩阵值为Ei,计算各Ei的绝对值,将其称为|E|,计算其平均值为定义筛选阈值k,当时,相应的第i个波长变量被保留下来用于构建光谱和多个葡萄酒品质参数之间的定量LSSVR模型;5.利用训练集构建的LSSVR模型预测检验集中样品的品质参数值,计算检验集中每个品质参数的均方根误差(RMSEV);6.不断调整筛选阈值k,重复步骤4-5,当检验集的RMSEV达到最小值且数值稳定时,对应的阈值k为最佳筛选阈值,对应的波长数目为最佳保留波长数目。利用筛选出的波长变量用于训练集构建LSSVR模型,同时来预测预测集样品的9个品质参数,计算得到的预测均方根误差(RMSEP)、回收率(Recovery)及保留波长数目(Nm)如表1所示。结果说明FD-VS方法是一个有效的筛选红外光谱特征波长用于同时定量预测多个红酒品质参数的方法。表1FD-VS-LSSVR方法的预测结果本文档来自技高网
...

【技术保护点】
1.一种筛选红外光谱特征波长用于检测红酒主要品质参数的方法,其特征在于,包括如下步骤:/n(1)采集已知某些品质参数的葡萄酒样品的傅里叶变换红外光谱数据,随机分为训练集和检验集;/n(2)对训练集样本光谱进行Fisher判别分析,得到变量特征矩阵E;/n(3)令第i个波长对应的特征矩阵值为E

【技术特征摘要】
1.一种筛选红外光谱特征波长用于检测红酒主要品质参数的方法,其特征在于,包括如下步骤:
(1)采集已知某些品质参数的葡萄酒样品的傅里叶变换红外光谱数据,随机分为训练集和检验集;
(2)对训练集样本光谱进行Fisher判别分析,得到变量特征矩阵E;
(3)令第i个波长对应的特征矩阵值为Ei,特征矩阵E的绝对值的平均值为定义筛选阈值k,当时,相应的波长变量被保留下来用于构建葡萄酒光谱和多个品质参数的定量最...

【专利技术属性】
技术研发人员:李艳坤庞佳烽马昕鹏董汝南景璟
申请(专利权)人:华北电力大学保定
类型:发明
国别省市:河北;13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1