一种基于多模型加权平均的酒醅近红外光谱建模方法技术

技术编号:33133049 阅读:30 留言:0更新日期:2022-04-17 00:53
本发明专利技术涉及近红外光谱检测技术,为了提升酒醅近红外光谱模型的稳定性及预测准确率,提供了一种基于多模型加权平均的酒醅近红外光谱建模方法,包括:1、获取光谱原数据并进行数据集划分:将光谱原数据整体作为训练集T1;将光谱原数据随机划分为训练集T2、验证集V2;将光谱原数据中临近预测集采集时间的A个数据作为验证集V3,剩余样本做为训练集T3;2、对划分后的数据分别进行预处理;3、对预处理后的训练集数据分别采用PLS建模;4、设置模型评价指标;5、根据模型评价指标进行模型筛选并保存最优模型及对应的建模参数;6、计算三种模型对应的加权值;7、根据加权值重新建模并保存。采用上述方式提升了模型的稳定性及预测准确率。述方式提升了模型的稳定性及预测准确率。述方式提升了模型的稳定性及预测准确率。

【技术实现步骤摘要】
一种基于多模型加权平均的酒醅近红外光谱建模方法


[0001]本专利技术涉及近红外光谱检测
,具体是一种基于多模型加权平均的酒醅近红外光谱建模方法。

技术介绍

[0002]传统固态白酒酿造过程是一个典型的酿酒微生物群落共生、共酵、代谢调控的过程,酒糟成分配比是整个酿酒生产系统运行控制的关键因子,对最终产品的品质有着极为重要和关键的影响。白酒酒醅的理化分析,作为酿酒企业重要的质量控制手段,其结果对于酿酒生产指导、酒醅配料调整、质量控制有着不可替代的作用。但是传统的理化分析方法存在检测方法落后、工作量大、耗时长、耗费人力多、结果反馈不及时等诸多问题,成为了困扰整个行业的技术难点,制约着其在大规模生产中的进一步应用。从2003年开始,各大白酒企业逐渐引进国外大型的傅里叶变换近红外光谱设备用于酒醅的分析,但分析近20年以来用于酒醅检测的近红外光谱应用发现,这些设备仅局限于完成实验室酒醅样本的抽检工作,且操作专业复杂,同时这些设备对工作环境的温度、湿度、抗震等有严格的要求,这就造成了其无法用于生产现场的大面积推广应用。
[0003]随着微机电技术的发展,近几年,便携式光谱仪被广泛应用于食品、饮料、医药、煤炭等各个领域,相较于传统的大型光谱分析系统,其具有结构简单、成本低廉、携带方便、结果实时可见等优势,目前已成为光谱领域的热门产品。但其自身也存在一定的不足,如稳定性、运行效率、准确率等仍与传统的实验室大型设备有一定的差距,需在硬件、算法等方面加以不断优化。尤其是针对酒醅样品,鉴于其固液混合的物理形态,同时随着环境的变化,时间的推移,其处于一种持续不断发酵的变化状态中,故通过便携式近红外光谱仪采集的光谱数据,很容易受各种因素的干扰,模型预测的准确率波动较大,无法批量大面积地应用于产线上。

技术实现思路

[0004]为了提升酒醅近红外光谱模型的稳定性及预测准确率,本专利技术提供了一种基于多模型加权平均的酒醅近红外光谱建模方法。
[0005]本专利技术解决上述问题所采用的技术方案是:
[0006]一种基于多模型加权平均的酒醅近红外光谱建模方法,包括:
[0007]步骤1、获取光谱原数据并进行数据集划分:将光谱原数据整体作为训练集T1;将光谱原数据随机划分为训练集T2、验证集V2;将光谱原数据中临近预测集采集时间的A个数据作为验证集V3,剩余样本作为训练集T3;
[0008]步骤2、对步骤1中经过数据集划分后的3组数据分别进行至少两种预处理;
[0009]步骤3、对预处理后的训练集数据T1、T2、T3分别采用PLS建模;
[0010]步骤4、设置模型评价指标;
[0011]步骤5、根据模型评价指标进行模型筛选并保存最优模型及对应的建模参数;
[0012]步骤6、根据建模参数分别计算三种模型对应的加权值;
[0013]步骤7、根据加权值重新建模并保存。
[0014]进一步地,所述步骤2中数据预处理的方法包括:高斯平滑、高斯求导、SG平滑法、去趋势及标准化。
[0015]进一步地,所述步骤4包括:采用训练集T1进行建模的模型采用最小RMSECV指标筛选最优模型,其中Y为真实值,Yp为采用留一法交叉验证的预测值,n为训练集样本数量;采用训练集T2、T3进行建模的模型采用对应验证集最大预测准确率指标筛选最优模型。
[0016]进一步地,所述步骤5中建模参数包括:线性拟合参数值Beta及相关系数值R2。
[0017]进一步地,所述步骤6计算加权值采用的公式为:分别对应训练集T1、T2、T3。
[0018]进一步地,所述步骤7中重新建立的模型为:Yp=t1×
Beta1×
X
p1
+t2×
Beta2×
X
p2
+t3×
Beta3×
X
p3
,其中X
p1
为未知样本的光谱数据经T1对应的最优模型的预处理方法得到的数据,X
p2
为未知样本的光谱数据经T2对应的最优模型的预处理方法得到的数据,X
p3
为未知样本的光谱数据经T3对应的最优模型的预处理方法得到的数据。
[0019]本专利技术相比于现有技术具有的有益效果是:针对酒醅样品固液混合的特殊形态及便携式光谱仪波段有限,通过设置三种不同训练集的划分方式,有效消除了酒糟一直处于持续发酵变化这一形态引起的误差,同时引入统计学的平均思想,有效屏蔽掉了样本、硬件等不稳定因素带来的波动,从而使得建模模型形态趋于稳定,有利于大面积推广于车间应用,同时经过验证,模型的预测准确率相较单一模型提升了近10%,为便携式光谱仪在各个行业的推广提供了有效的算法支撑。
附图说明
[0020]图1为基于多模型加权平均的酒醅近红外光谱建模方法的流程图;
[0021]图2为实施例对应的流程图。
具体实施方式
[0022]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合实施例,对本专利技术进行进一步的详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0023]如图1所示,一种基于多模型加权平均的酒醅近红外光谱建模方法,包括:
[0024]步骤1、获取光谱原数据并进行数据集划分:将光谱原数据整体作为训练集T1;将光谱原数据随机划分为训练集T2、验证集V2;将光谱原数据中临近预测集采集时间的A个数据作为验证集V3,剩余样本作为训练集T3;
[0025]步骤2、对步骤1中经过数据集划分后的3组数据分别进行至少两种预处理,预处理方法包括:高斯平滑、高斯求导、SG平滑法、去趋势及标准化等;
[0026]步骤3、对预处理后的训练集数据T1、T2、T3分别采用PLS建模;
[0027]步骤4、设置模型评价指标;如:采用训练集T1进行建模的模型采用最小RMSECV指标筛选最优模型,其中Y为真实值,Yp为采用留一法交叉验证的预测值,n为训练集样本数量;采用训练集T2、T3进行建模的模型采用对应验证集最大预测准确率指标筛选最优模型;
[0028]步骤5、根据模型评价指标进行模型筛选并保存最优模型及对应的建模参数;包括预处理方法及参数,线性拟合参数值Beta及相关系数值R2等。
[0029]步骤6、根据建模参数分别计算三种模型对应的加权值,具体计算公式为:步骤6、根据建模参数分别计算三种模型对应的加权值,具体计算公式为:分别对应训练集T1、T2、T3;
[0030]步骤7、根据加权值重新建模并保存,重新建立的模型为:Yp=t1×
Beta1×
X
p1
+t2×
Beta2×
X
p2
+t3×
Beta3×
X
p3
,其中X
p1
为未知样本的光谱数据经T1对应的最优模型的预处理方法得到的数据,X
p2
为未知样本的光谱数据经T2本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多模型加权平均的酒醅近红外光谱建模方法,其特征在于,包括:步骤1、获取光谱原数据并进行数据集划分:将光谱原数据整体作为训练集T1;将光谱原数据随机划分为训练集T2、验证集V2;将光谱原数据中临近预测集采集时间的A个数据作为验证集V3,剩余样本作为训练集T3;步骤2、对步骤1中经过数据集划分后的3组数据分别进行至少两种预处理;步骤3、对预处理后的训练集数据T1、T2、T3分别采用PLS建模;步骤4、设置模型评价指标;步骤5、根据模型评价指标进行模型筛选并保存最优模型及对应的建模参数;步骤6、根据建模参数分别计算三种模型对应的加权值;步骤7、根据加权值重新建模并保存。2.根据权利要求1所述的一种基于多模型加权平均的酒醅近红外光谱建模方法,其特征在于,所述步骤2中数据预处理的方法包括:高斯平滑、高斯求导、SG平滑法、去趋势及标准化。3.根据权利要求1所述的一种基于多模型加权平均的酒醅近红外光谱建模方法,其特征在于,所述步骤4包括:采用训练集T1进行建模的模型采用最小RMSECV指标筛选最优模型,其中Y为真实值,Yp为采用留一法交叉验证的预测值,n为训练集样本数量;采用训练集T2、T3进行建模的模型采...

【专利技术属性】
技术研发人员:贾利红闫晓剑张国宏何涛
申请(专利权)人:四川启睿克科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1