一种茶叶干燥过程中的水分含量预测方法及处理终端技术

技术编号:37064069 阅读:11 留言:0更新日期:2023-03-29 19:42
本发明专利技术公开了一种茶叶干燥过程中的水分含量预测方法及处理终端,该方法包括:构建单批次机器学习训练的数据集;将训练数据集划分为校正集和预测集,通过新增不同批次样本数据集归并到原数据集形成新的数据集进行训练以更新模型参数,以评价函数作为目标函数来挑选最优的模型参数;将CARS

【技术实现步骤摘要】
一种茶叶干燥过程中的水分含量预测方法及处理终端


[0001]本专利技术涉及机器学习和计算机图像
,具体涉及一种茶叶干燥过程中的水分含量预测方法及处理终端。

技术介绍

[0002]茶作为世界上最受欢迎的饮料之一,每年有超过全球人口的1/3消费茶。茶的种类繁多,例如绿茶、青茶、白茶、红茶、黑茶等。茶叶的制作工艺也较为复杂,一般制作工序有萎凋、做青、炒青、发酵和烘焙干燥等。茶叶成分在不同的制作工序中变化和相互转化,而茶味的变化主要归因于制作工艺中这些茶叶成分的组成和各自比例,其中水分含量的变化伴随整个茶制作过程以及后续的茶叶存储,其含量的变化关乎茶叶成品质量的高低和存储茶叶方案的设计。由此茶叶水分含量的检测也越来越受到茶叶加工场和商户们的重视。
[0003]传统的烘干法和蒸馏法效率低,难以满足生产过程中实时检测茶叶含水量的要求。鉴于传统方法的缺点,有必要开发一种快速无损的方法来检测茶叶的含水量。而随着机器学习的发展和无损检测设备的普及,高光谱成像技术也越来越多的被应用于检测工作中。近红外和核磁共振技术具有快速无损、成本低、重现性好、环境友好等优点,在食品、农业、制药和石油化工等领域被广泛用作强有力的分析工具。对于茶叶的研究中,近红外光谱信息可以反映叶片的内部化学信息,这是因为近红外波长范围对应于官能团(如CO和OH)的倍频和频率组合吸收。高光谱成像技术已被用于咖啡因的测量,表没食子儿茶素没食子酸酯和表儿茶素,总抗氧化能力的预测,茶饮料中可溶性固形物含量和pH值的测定,基于反射光谱的鲜茶叶叶绿素指数的诊断和茶叶品种的鉴别。李晓丽等人提出了一种通过近红外光谱法测定茶叶干物质含量的方案。作为一种典型的含氢物质,水分也可以通过近红外光谱技术进行无损检测。
[0004]尽管在应用高光谱成像技术测定茶叶中化学物质含量方面取得了重要进展,但最近研究中出现的一个关键问题是,几乎所有预测模型都是基于单个批次一个年份的鲜茶样本构建的,并且未对预测结果的长期稳定性进行检验。这些模型很难有效预测来源差异较大的茶叶样品的水分含量。实际上,茶叶的内部物理性质和化学成分应随生长环境而变化,这反过来又对不同环境中生长的茶叶的光学行为(例如反射率光谱)、物理表征和水分含量高低产生复杂的影响。因此,具有差异性特征的光谱是茶叶水分预测需要考虑的关键因素。而往往只针对某一年份或特定时期采摘的茶叶样本进行设计的预测方法是无法适用于未来其他时期采摘的茶叶样本。

技术实现思路

[0005]本专利技术的目的在于克服现有技术的缺点和不足,提出一种茶叶干燥过程中的水分含量预测方法及处理终端,大大扩展了技术应用场景,不再是以往根据茶叶生长的气候和环境变化而每年重建模型以及调整参数,而是通过特征光谱选择校正变量参数和新增多批次样本量以建立增量型的训练数据集,利用该数据集来优化模型参数实施预测。
[0006]为此,本专利技术的公开了一种茶叶干燥过程中的水分含量预测方法,所述方法包括:获取多个年份的多个批次的茶叶样本,并根据采摘时间的先后顺序依次对样本进行编号;
[0007]利用第一批次的茶叶的含水率及第一批次的茶叶的近红外反射率光谱构建单批次机器学习训练的数据集;
[0008]将训练数据集划分为校正集和预测集,通过新增不同批次样本数据集归并到原数据集形成新的数据集进行训练以更新模型参数,以评价函数作为目标函数来挑选最优的模型参数;
[0009]将CARS

ICA算法进一步集成到PLSR回归模型中,通过PLSR回归模型预测得到各批次茶叶水分含量。
[0010]优选地,所述利用第一批次的茶叶的含水率及第一批次的茶叶的近红外反射率光谱构建单批次机器学习训练的数据集之后,还包括:
[0011]对数据集中的近红外反射率光谱进行卷积平滑预处理;
[0012]计算每批茶叶的平均含水量和标准差以及对应的平均光谱,分析其中的差异性;
[0013]依据多批次茶叶样本的差异性,引入CARS变量选择算法选取对与水分有强烈映射区域的特征光谱,并将特征光谱作为主要因变量进行机器学习的训练;
[0014]以CARS变量选择算法选取的特征光谱变量为基础,利用ICA算法针对特征光谱中的对水分更加敏感的独立变量进行再次分离提取;获得改进的特征变量提取方法:CARS

ICA。
[0015]优选地,所述引入CARS变量选择算法选取对与水分有强烈映射区域的特征光谱,具体包括:
[0016]计算多个茶叶样本水分的平均值和方差以及对应的平均光谱,发现不同批次间样本因生长环境或生长周期不同而显示巨大差异;
[0017]采用指数递减函数和自适应加权抽样选择较大个体的PLSR回归系数绝对值;
[0018]根据交叉验证方法,选择交互验证的最小均方根误差子集作为特征光谱,并发现所选择的特征波长均处于不同批次样本中存在较大差异的光谱区域。对样本差异性和特征光谱进行了相互验证。
[0019]优选地,所述利用ICA算法针对特征光谱中的对水分更加敏感的独立变量进行再次分离提取,具体包括:
[0020]将特征光谱和独立分量之间的联系类比于混合信号和源信号之间的关系,建立概率密度函数;
[0021]利用极大似然估计方法得到基于概率密度函数的似然函数,并通过梯度上升法迭代更新最大值确定特征光谱中的独立分量。
[0022]优选地,通过新增不同批次样本数据集归并到原数据集形成新的数据集进行训练以更新模型参数,具体包括:
[0023]利用评价指标作为目标函数,不断归并新批次样本数据集到旧数据集中得到新的数据集进行训练优化模型参数;
[0024]通过PLSR回归得到茶叶样本的水分含量预测值,并计算Rc2,RMSEC,Rp2和RMSEP指标,以评估SG

CARS

ICA

PLSR模型的性能;
[0025]将第3批和第4批的样本量以每4个小样本量为单位进行分割,并依次合并到第1批
和第2批的样本中,以研究使模型预测效果趋于稳定的最小样本量。
[0026]优选地,所述获取多个年份的多个批次的茶叶样本,并根据采摘时间的先后顺序依次对样本进行编号;之后还包括:
[0027]对鲜叶进行烘干操作,并利用量秤获取鲜叶和烘干后叶片的重量,领用近红外高光谱成像仪获取鲜叶的的近红外高光谱图像和烘干后叶片的近红外高光谱图像;
[0028]通过叶片质量和干重计算得出茶叶干燥过程中的含水率,利用反射率校正方法削弱仪器暗电流噪声并得到近红外反射率光谱数据。
[0029]本专利技术的第二个目的可以通过采取如下技术方案达到:
[0030]一种处理终端,包括处理器以及用于存储处理器可执行程序的存储器,所述处理器执行存储器存储的程序时,所述处理终端执行时,实现上述的一种茶叶干燥过程中的水分含量预测方法。
[0031]本专利技术所提供的预测方法还将不同批次茶叶特性和特征光谱变量与水分含量相关联,并通本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种茶叶干燥过程中的水分含量预测方法,其特征在于,所述方法包括:获取多个年份的多个批次的茶叶样本,并根据采摘时间的先后顺序依次对样本进行编号;利用第一批次的茶叶的含水率及第一批次的茶叶的近红外反射率光谱构建单批次机器学习训练的数据集;将训练数据集划分为校正集和预测集,通过新增不同批次样本数据集归并到原数据集形成新的数据集进行训练以更新模型参数,以评价函数作为目标函数来挑选最优的模型参数;将CARS

ICA算法进一步集成到PLSR回归模型中,通过PLSR回归模型预测得到各批次茶叶水分含量。2.根据权利要求1所述的一种茶叶干燥过程中的水分含量预测方法,其特征在于,所述利用第一批次的茶叶的含水率及第一批次的茶叶的近红外反射率光谱构建单批次机器学习训练的数据集之后,还包括:对数据集中的近红外反射率光谱进行卷积平滑预处理;计算每批茶叶的平均含水量和标准差以及对应的平均光谱,分析其中的差异性;依据多批次茶叶样本的差异性,引入CARS变量选择算法选取对与水分有强烈映射区域的特征光谱,并将特征光谱作为主要因变量进行机器学习的训练;以CARS变量选择算法选取的特征光谱变量为基础,利用ICA算法针对特征光谱中的对水分更加敏感的独立变量进行再次分离提取;获得改进的特征变量提取方法:CARS

ICA。3.根据权利要求2所述的一种茶叶干燥过程中的水分含量预测方法,其特征在于,所述引入CARS变量选择算法选取对与水分有强烈映射区域的特征光谱,具体包括:计算多个茶叶样本水分的平均值和方差以及对应的平均光谱,发现不同批次间样本因生长环境或生长周期不同而显示巨大差异;采用指数递减函数和自适应加权抽样选择较大个体的PLSR回归系数绝对值;根据交叉验证方法,选择交互验证的最小均方根误差子集作为特征光谱,并发现所选择的特征波长均处于不同批次样本中存在较大差异的光谱区域。对样...

【专利技术属性】
技术研发人员:龙拥兵汤新宇梁俊涛姚志杰白书黛袁宇翔匡润徐海涛邓海东兰玉彬
申请(专利权)人:华南农业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1