当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于微波扫频技术和Stacking集成模型的茶叶籽仁含水率检测方法及系统技术方案

技术编号:36158750 阅读:33 留言:0更新日期:2022-12-31 20:06
本发明专利技术公开了一种基于微波扫频技术和Stacking集成模型的茶叶籽仁含水率检测方法及系统,属于茶叶籽品质检测领域。具体包括:1.获取微波扫频数据集;2.归一化处理并基于Ridge

【技术实现步骤摘要】
一种基于微波扫频技术和Stacking集成模型的茶叶籽仁含水率检测方法及系统


[0001]本专利技术涉茶叶籽品质检测领域,尤其涉及一种基于微波扫频技术和Stacking集成模型的茶叶籽仁含水率检测方法及系统。
技术背景
[0002]籽仁含水率是茶叶籽油制备加工中的一项重要监测指标,在茶籽脱壳的工序中,籽仁水分含量过高会导致脱壳困难,过低则会在脱壳时被过度破碎,需要将其含水率控制在7%左右;在调制增香的工序中,为保证籽仁处在最适合压榨出油的状态,也需要控制其含水率在5%

6%。实现对茶叶籽仁的快速、精准且无损的含水率检测,对于促进茶叶籽油的优质高效生产具有重要价值。
[0003]目前针对农业物料水分无损检测的研究主要基于电测法、机器视觉法和光谱法,但这三种方法在实际应用上各有缺陷。电测法可以分为电容法和电阻法,原理简单且快速便捷,但易受物料种类、坚实度和温湿度等多重因素影响,测量稳定性差;机器视觉法通过提取与物料含水率相关联的表面纹理或颜色特征来判断真实的含水率值,而这会损失一些反映物料内部水分信息的深层特征,从而限制检测精度;光谱法主要包括近红外法和高光谱法,近红外光的穿透深度在微米级,同样难以获取能够代表物料整体水分的测量信息,而高光谱法结合了光谱和成像技术,可以获取更丰富的水分关联信息,但高光谱设备的购置和维护成本高昂,对海量测量数据的传输和处理也是制约其实际应用的难点。
[0004]微波是指频率在300MHz

300GHz之间的电磁波,穿透深度可达厘米级,当微波穿透含水物料时,其大部分能量会被极性极强的水分子所吸收,引起微波信号中振幅、相位等参量的变化,从而推算出物料的水分含量。微波法具有非接触、高穿透力和响应快速等优点,且具有比高光谱技术更低的仪器成本,是一种理想的农业物料水分检测方法,但在现有研究中未见有将其应用于茶叶籽水分检测领域的相关讨论。

技术实现思路

[0005]本专利技术的目的是克服现有的无损检测技术在农业物料水分检测方面的缺陷,提供一种基于微波扫频技术和Stacking集成模型的茶叶籽仁含水率检测方法及系统。本专利技术通过检测一组微波扫频信号穿透待测样品前后的振幅和相位变化,获取可以反映样品内部整体水分分布的丰富关联信息;采用Stacking集成模型建立微波信号特征和茶叶籽仁样品含水率之间的关系模型,相较于单个机器学习算法,可对茶叶籽仁的含水率进行更高精度的估计;在选择Stacking集成模型的基学习器时,设计了基于模型在交叉验证集和测试集上表现的混合评价指标,以降低一般Stacking方法在选择基学习器上的经验性和主观性。
[0006]为了达到以上目的,本专利技术采取如下技术方案:
[0007]一方面,本专利技术提供一种基于微波扫频技术和Stacking集成模型的茶叶籽仁含水率检测方法,具体包括:
[0008](1)使用微波检测平台测量一组扫频微波信号穿透茶叶籽仁样品前后的参量变化数据,包括振幅和相位,并标记所有样品的含水率属性值,获得扫频微波数据集S0∈R
m*2n
,其中,m表示样本个数,n表示扫频微波信号中的频点个数;
[0009](2)将扫频微波数据集S0按比例随机划分为训练集S1和测试集S2,先对训练集S1做归一化处理,基于训练集S1确定归一化公式的系数后,再将相同的公式运用到对测试集S2的归一化处理中,得到预处理后的训练集S
′1和测试集S
′2;
[0010](3)使用岭回归

递归特征消除算法在预处理后的训练集S
′1上进行包装式特征选择,得到训练子集FS
′1,记录FS
′1中的所有特征在S
′1中的序号,再在测试集S
′2中筛选出相同序号的特征,得到测试子集FS
′2;
[0011](4)分别使用Q种候选回归算法在特征选择后的训练子集FS
′1上基于K折交叉验证方法训练Q种候选模型,计算得到模型训练效果的评价指标IN1;再利用基于特征选择后的训练子集FS
′1训练的候选模型分别去拟合特征选择后的测试子集FS
′2中的数据,计算得到模型测试效果的评价指标IN2;
[0012](5)基于IN1和IN2计算得到模型性能的混合评价指标IN3,根据IN3的值将所有候选模型倒序排列,选择排在前L位的候选模型;
[0013](6)利用步骤(3)得到的特征选择后的训练子集FS
′1和步骤(5)选择的L种候选模型对应的回归算法训练Stacking集成模型第一层的基学习器,利用多元线性回归算法训练第二层的元学习器,训练得到具有双层结构的Stacking集成模型;
[0014](7)利用步骤(6)训练好的Stacking集成模型检测待测茶叶籽仁样本的含水率。
[0015]进一步地,所述步骤(1)中获取的扫频微波数据集S0表示为:
[0016]S0={A1,A2,

,A
i
,

,A
n
,P1,P2,

,P
j
,

,P
n
}
[0017]其中,A
i
={a
i1
,a
i2
,

,a
im
}表示第i个频率信号对应的衰减特征向量,a
im
表示第m个样本对应的第i个频率信号的微波衰减值;P
j
={p
j1
,p
j2
,

,p
jm
}表示第j个频率信号对应的相移特征向量,p
jm
表示第m个样本对应的第i个频率信号的微波相移值。
[0018]进一步地,所述步骤(2)中的归一化公式具体为:
[0019][0020]其中,X
i
表示第i个特征向量,x
ik
表示第k个样本的第i个特征值,x

ik
表示归一化后的第k个样本的第i个特征值;根据训练集S1的数据计算确定max(X
i
)和min(X
i
)两个系数后,再将上式直接运用到对测试集S2的归一化处理中。
[0021]进一步地,所述步骤(3)中的包装式特征选择方法具体为:
[0022](3.1)使用岭回归算法训练基于预处理后的训练集S
′1的回归预测模型,生成S
′1中各个特征相应的权重σ
i
,剔除σ
i
最小的一个特征以更新S
′1;
[0023](3.2)设定选择的特征个数为N
f
,重复步骤(3.1),直至S
′1中的特征个数减少至N
f
,得到特征选择后的训练子集FS
′1。
[0024]进一步地,所述步骤本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于微波扫频技术和Stacking集成模型的茶叶籽仁含水率检测方法,其特征在于,包括:(1)使用微波检测平台测量一组扫频微波信号穿透茶叶籽仁样品前后的参量变化数据,包括振幅和相位,并标记所有样品的含水率属性值,获得扫频微波数据集S0∈R
m*2n
,其中,m表示样本个数,n表示扫频微波信号中的频点个数;(2)将扫频微波数据集S0按比例随机划分为训练集S1和测试集S2,先对训练集S1做归一化处理,基于训练集S1确定归一化公式的系数后,再将相同的公式运用到对测试集S2的归一化处理中,得到预处理后的训练集S
′1和测试集S
′2;(3)使用岭回归

递归特征消除算法在预处理后的训练集S
′1上进行包装式特征选择,得到训练子集FS
′1,记录FS
′1中的所有特征在S
′1中的序号,再在测试集S
′2中筛选出相同序号的特征,得到测试子集FS
′2;(4)分别使用Q种候选回归算法在特征选择后的训练子集FS
′1上基于K折交叉验证方法训练Q种候选模型,计算得到模型训练效果的评价指标IN1;再利用基于特征选择后的训练子集FS
′1训练的候选模型分别去拟合特征选择后的测试子集FS
′2中的数据,计算得到模型测试效果的评价指标IN2;(5)基于IN1和IN2计算得到模型性能的混合评价指标IN3,根据IN3的值将所有候选模型倒序排列,选择排在前L位的候选模型;(6)利用步骤(3)得到的特征选择后的训练子集FS
′1和步骤(5)选择的L种候选模型对应的回归算法训练Stacking集成模型第一层的基学习器,利用多元线性回归算法训练第二层的元学习器,训练得到具有双层结构的Stacking集成模型;(7)利用步骤(6)训练好的Stacking集成模型检测待测茶叶籽仁样本的含水率。2.根据权利要求1所述的一种基于微波扫频技术和Stacking集成模型的茶叶籽仁含水率检测方法,其特征在于,所述步骤(1)中获取的扫频微波数据集S0表示为:S0={A1,A2,...,A
i
,...,A
n
,P1,P2,...,P
j
,...,P
n
}其中,A
i
={a
i1
,a
i2
,...,a
im
}表示第i个频率信号对应的衰减特征向量,a
im
表示第m个样本对应的第i个频率信号的微波衰减值;P
j
={p
j1
,p
j2
,...,P
jm
}表示第j个频率信号对应的相移特征向量,p
jm
表示第m个样本对应的第i个频率信号的微波相移值。3.根据权利要求1所述的一种基于微波扫频技术和Stacking集成模型的茶叶籽仁含水率检测方法,其特征在于,所述步骤(2)中的归一化公式具体为:其中,X
i
表示第i个特征向量,x
ik
表示第k个样本的第i个特征值,x

ik
表示归一化后的第k个样本的第i个特征值;根据训练集S1的数据计算确定max(X
i
)和min(X
i
)两个系数后,再将上式直接运用到对测试集S2的归一化处理中。4.根据权利要求1所述的一种基于微波扫频技术和Stacking集成模型的茶叶籽仁含水率检测方法,其特征在于,所述步骤(3)中的包装式特征选择方法具体为:(3.1)使用岭回归算法训练基于预处理后的训练集S
′1的回归预测模型,生成S
′1中各个特征相应的权重σ
i
,剔除σ
i
最小的一个特征以更新S
′1;(3.2)设定选择的特征个数为N
f
,重复步骤(3.1),直至S
′1中的特征个数减少至N
f
,得到
特征选择后的训练子集FS
′1。5.根据权利要求1所述的一种基于微波扫频技术和Stacking集成模型的茶叶籽仁含水率检测方法,其特征在于,所述步骤(4)中的模型评价指标IN1和IN2的计算公式分别为:的计算公式分别为:其中,和分别表示模型在特征选择后的训练子集上的平均绝对误差、均方根误差和决定系数;MAE
p
,RMSE
p
和分别表示模型在特征选择后的测试子...

【专利技术属性】
技术研发人员:韦真博吴晨媛王俊杜冬冬朱建锡陈长卿
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1