基于回归系数二次函数激活的烟叶热水可溶物测定方法技术

技术编号:21031113 阅读:48 留言:0更新日期:2019-05-04 04:18
本发明专利技术公开了基于回归系数二次函数激活的烟叶热水可溶物测定方法。本发明专利技术检测烟叶原料的近红外光谱,采用索氏提取法准确测定烟叶原料的热水可溶物含量,整个检测样品集数据划分为训练集和测试集,基于训练集样本构建近红外光谱和热水可溶物含量的回归方程,记录回归系数图谱和矩阵,之后以二次U型函数作为激活函数,提取对热水可溶物含量贡献度较大的特征谱段,构建谱段提取后定量预测模型,从而快速、准确测定烟叶原料热水可溶物含量。本发明专利技术利用计算智能方法提取烟叶原料热水可溶物的近红外特征谱段并以此为基础快速测定热水可溶物含量,方法简单易行、操作简单、建立的表征方法更具客观性,对烟叶品质评价具有较好的指导性和实用性。

Method for determination of hot water soluble matter in tobacco leaves based on quadratic function activation of regression coefficient

The invention discloses a method for determining hot water soluble matter of tobacco leaves based on quadratic function activation of regression coefficient. The method detects the near infrared spectra of tobacco leaf raw materials, uses Soxhlet extraction method to accurately determine the content of hot water soluble substances in tobacco leaf raw materials, and divides the whole test sample set data into training set and testing set. Based on the training set samples, the regression equation of near infrared spectra and hot water soluble substance content is constructed, and the regression coefficient atlas and matrix are recorded. Then, the quadratic U-function is used as the activation function. A quantitative prediction model was constructed based on the characteristic bands which contributed a lot to the content of hot water soluble substances, so that the content of hot water soluble substances in tobacco raw materials could be determined quickly and accurately. The invention extracts the near infrared characteristic spectral band of hot water soluble matter of tobacco raw material by computational intelligence method and quickly determines the content of hot water soluble matter based on it. The method is simple, easy to operate, and the established characterization method has more objectivity, and has better guidance and practicability for tobacco quality evaluation.

【技术实现步骤摘要】
基于回归系数二次函数激活的烟叶热水可溶物测定方法
本专利技术涉及一种烟叶热水可溶物测定方法,尤其是基于回归系数二次函数激活的烟叶热水可溶物测定方法。
技术介绍
烟叶是卷烟工业的基础,要稳定并提高卷烟产品的质量和扩大产品的市场占有率,卷烟所使用的烟叶至关重要。每一个高质量卷烟的开发都是建立在稳定的高质量烟叶原料的供应基础之上。烟叶品质是反映和体现烟叶必要性状均衡情况的综合性模糊概念,受烟叶的产区、部位、外观质量、物理特性、化学成分、烟气成分和感官评吸质量等方面多项因素综合作用的影响。热水可溶物含量指的是烟叶原料经过热水完全萃取后,水可溶物占烟叶干重的质量百分含量,该指标影响到烟叶的物理、化学、烟气和感官等品质,是烟叶原料质量的一个非常重要的指标。针对烟叶原料粉末和8mm碎片的近红外光谱采用漫反射方式进行采集。近红外漫反射光进入样品内部后,发生无数次反射、折射、衍射、吸收后,返回入射面的光,这种分析光负载了样品的结构和组成信息,是一项快速、对环境友好的检测技术,目前应用近红外漫反射光谱分析技术测定烟草化学成分、风格、均匀性等方面已有报道,虽然现有技术有将其用于测定再造烟叶的热水可溶物,但是该方法得到的结果准确性不够高,同时,烟叶原料热水可溶物与再造烟叶的热水可溶物并不相同。感官质量是卷烟产品质量的重要组成部分,是产品质量的基础和核心,是指烟支在燃烧过程中产生的主流烟气对人体感官产生的综合感受,如香气的质和量、口感的舒适度等;还包括代表产品风格特征的因素,如烟叶风格类型、香韵特征等。长期以来,烟叶原料质量的评价主要靠感官评吸,而感官评吸对烟叶质量评价虽然行之有效,但需要评吸人员具有丰富的实践经验,且主要靠人的主观判断,不同的评吸水平、感官条件会造成评吸结果存在较大的差异。通过化学检测评价烟叶质量,虽然可实现大量化学成分的定性和定量分析,但也不能表征感官品质。鉴于此,有必要开发一种有效、简单、更加准确的表征烟叶原料感官质量的方法。
技术实现思路
本专利技术为了克服现有技术的不足,提供一种有效、简单、准确进行热水可溶物含量近红外光谱特征谱段提取和热水可溶物含量快速测定的方法,本专利技术通过将回归系数进行二次U型函数激活来选择特征谱段,基于提取的特征谱段构建热水可溶物含量定量预测模型,从而预测烟叶原料热水可溶物含量。本专利技术的目的通过以下技术方案予以实现:基于回归系数二次函数激活的烟叶热水可溶物测定方法,包括如下步骤:步骤(1),样品的收集:收集一批具有代表性的烟叶原料样品;步骤(2),近红外光谱采集:利用布鲁克MATRIX-I光谱仪采集步骤(1)收集到的烟叶的近红外光谱;步骤(3),热水可溶物含量测定:按现有方法测定步骤(1)中收集到的烟叶的热水可溶物含量;步骤(4),训练和测试样本集划分:采用Kennard-Stone方法随机划分步骤(2)采集的近红外光谱数据,2/3作为训练集,1/3作为测试集;将步骤(3)的热水可溶物含量作对应的训练集和测试集划分;步骤(5),烟叶热水可溶物含量回归模型的建立:将步骤(4)得到的训练集烟叶的近红外光谱数据和烟叶的热水可溶物含量数据利用PLS方法得到回归模型,具体如下:A、将已知烟叶的近红外光谱和热水可溶物含量数据对应列出,建立两类数据关联关系;B、运用PLS算法,构建烟叶热水可溶物含量回归模型;C、记录回归模型各光谱点的回归系数X-Loading矩阵,依据X-Loading形成回归系数图谱;步骤(6),特征谱段提取:以Y=X2二次函数作为谱段选择激活函数,各光谱点i对应的回归系数作为x,y=40000作为激活阈值,之后按照式(Ⅰ)判定该光谱点i是否被提取:,式(Ⅰ)步骤(7),烟叶热水可溶物含量定量预测模型构建:基于步骤(6)提取的热水可溶物含量对应的贡献度较大的特征谱段,结合步骤(4)得到的训练集烟叶的近红外光谱数据和烟叶的热水可溶物含量数据,利用PLS方法构建定量预测模型,具体如下:A、将步骤(6)所提取的特征谱段对应的近红外光谱和热水可溶物含量数据对应列出,建立两类数据关联关系;B、运用PLS算法,构建烟叶热水可溶物含量定量预测模型;C、将步骤(4)中测试集烟叶原料经步骤(6)特征谱段提取后的近红外光谱数据作为输入变量进行外部预测验证;步骤(8),测定烟叶原料热水可溶物含量:将待测定烟叶原料的近红外光谱输入步骤(7)建立的热水可溶物含量定量预测模型,即可快速测定得到热水可溶物含量。进一步地,步骤(1)中,所述的烟叶原料样品形态包括粉末和8mm碎片,针对两类样品形态均直接进行近红外光谱采集和热水可溶物含量测定。进一步地,所述步骤(2)的近红外光谱是通过下列方法获得的:将步骤(1)收集的两类烟叶原料样品,每个样品取五个平行样,每个平行样取200g,粉末样品放入小样品杯中,8mm碎片放入大样品杯中,均平铺于样品杯中,保证样品平整放置,厚度为2~3cm,用压样器轻压平整后,放到光谱仪旋转台上,采用漫反射的方式进行扫描并采集光谱,每个平行样扫一次光谱,每个样品对应5条平行光谱;针对5条平行光谱,利用马氏距离分析每条光谱偏离均值的程度,进而利用卡方分布评估每条光谱检测异常的风险水平,将风险水平超标的光谱剔除后,再将剩余光谱进行求平均得到一个平均光谱,依次对每个样品采用相同的方法进行扫描并计算光谱,得到每个样品对应的平均光谱。进一步地,步骤(4)中,所述的训练集和测试集是通过下列方法划分得到的:针对步骤(2)采集的近红外光谱,首先计算两两样本之间距离,选择距离最大的两个样品,然后分别计算剩余的样本与已选择的两个样本之间的距离,对于每个剩余样本而言,其与已选样品之间的最短距离被选择,然后选择这些最短距离中相对最长的距离所对应的样本,作为第三个样品;重复上述步骤,直至所选的样品的个数等于2/3样本集的数目为止,作为训练集;剩余1/3样品作为测试集。进一步地,步骤(5)中,所述的回归模型是基于近红外光谱全谱段构建了与热水可溶物含量的关联关系,确定了每个光谱点i的回归系数。针对全谱段构建了1×n的回归系数X-Loading矩阵,n为光谱点个数,通过X-Loading矩阵形成回归系数图谱,得到各光谱点对于热水可溶物含量的贡献程度。进一步地,步骤(7)中,烟叶热水可溶物含量定量预测模型构建的具体方法如下:(1)光谱预处理:针对每个样品平均光谱进行二阶导数、小波平滑和中心化预处理;(2)用偏最小二乘法将经过特征谱段提取后的光谱数据与其对应的热水可溶物测定数据进行拟合,根据Press值曲线的斜率变化程度自动选取建模主成分个数;(3)根据构建的定量预测模型对测试集样本进行预测验证:通过计算均方根误差的方法,确定测试样品集在定量预测模型中所得的预测值与相应的步骤(3)测定所得的参考值之间的偏差;依据热水可溶物含量标准测定方法,如果RMSE≤1,说明模型预测误差在允许范围之内,模型验证成功,该模型可用于测定烟叶原料的热水可溶物含量。与现有技术相比,本专利技术有益效果具体如下:(1)本专利技术的方法简单易行、操作简单,便于实际应用;(2)本专利技术提供近红外光谱测定烟叶原料热水可溶物的方法,简单、易行、快速,采用近红外光谱无损检测技术不仅能提高分析效率,节约成本,对于准确测定烟叶热水可溶物含量,提高检测效率,客观反应烟叶本文档来自技高网
...

【技术保护点】
1.基于回归系数二次函数激活的烟叶热水可溶物测定方法,其特征在于,包括如下步骤:步骤(1),样品的收集:收集一批具有代表性的烟叶原料样品;步骤(2),近红外光谱采集:利用布鲁克MATRIX‑I光谱仪采集步骤(1)收集到的烟叶的近红外光谱;步骤(3),热水可溶物含量测定:按现有方法测定步骤(1)中收集到的烟叶的热水可溶物含量;步骤(4),训练和测试样本集划分:采用Kennard‑Stone方法随机划分步骤(2)采集的近红外光谱数据,2/3作为训练集,1/3作为测试集;将步骤(3)的热水可溶物含量作对应的训练集和测试集划分;步骤(5),烟叶热水可溶物含量回归模型的建立:将步骤(4)得到的训练集烟叶的近红外光谱数据和烟叶的热水可溶物含量数据利用PLS方法得到回归模型,具体如下:A、将已知烟叶的近红外光谱和热水可溶物含量数据对应列出,建立两类数据关联关系;B、运用PLS算法,构建烟叶热水可溶物含量回归模型;C、记录回归模型各光谱点的回归系数X‑Loading矩阵,依据X‑Loading形成回归系数图谱,得到各光谱点对于热水可溶物含量的贡献程度;步骤(6),特征谱段提取:以Y=X

【技术特征摘要】
1.基于回归系数二次函数激活的烟叶热水可溶物测定方法,其特征在于,包括如下步骤:步骤(1),样品的收集:收集一批具有代表性的烟叶原料样品;步骤(2),近红外光谱采集:利用布鲁克MATRIX-I光谱仪采集步骤(1)收集到的烟叶的近红外光谱;步骤(3),热水可溶物含量测定:按现有方法测定步骤(1)中收集到的烟叶的热水可溶物含量;步骤(4),训练和测试样本集划分:采用Kennard-Stone方法随机划分步骤(2)采集的近红外光谱数据,2/3作为训练集,1/3作为测试集;将步骤(3)的热水可溶物含量作对应的训练集和测试集划分;步骤(5),烟叶热水可溶物含量回归模型的建立:将步骤(4)得到的训练集烟叶的近红外光谱数据和烟叶的热水可溶物含量数据利用PLS方法得到回归模型,具体如下:A、将已知烟叶的近红外光谱和热水可溶物含量数据对应列出,建立两类数据关联关系;B、运用PLS算法,构建烟叶热水可溶物含量回归模型;C、记录回归模型各光谱点的回归系数X-Loading矩阵,依据X-Loading形成回归系数图谱,得到各光谱点对于热水可溶物含量的贡献程度;步骤(6),特征谱段提取:以Y=X2二次函数作为谱段选择激活函数,各光谱点i对应的回归系数作为x,y=40000作为激活阈值,之后按照式(Ⅰ)判定该光谱点i是否被提取:,式(Ⅰ)步骤(7),烟叶热水可溶物含量定量预测模型构建:基于步骤(6)提取的热水可溶物含量对应的贡献度较大的特征谱段,结合步骤(4)得到的训练集烟叶的近红外光谱数据和烟叶的热水可溶物含量数据,利用PLS方法构建定量预测模型,具体如下:A、将步骤(6)所提取的特征谱段对应的近红外光谱和热水可溶物含量数据对应列出,建立两类数据关联关系;B、运用PLS算法,构建烟叶热水可溶物含量定量预测模型;C、将步骤(4)中测试集烟叶原料经步骤(6)特征谱段提取后的近红外光谱数据作为输入变量进行外部预测验证;步骤(8),测定烟叶原料热水可溶物含量:将待测定烟叶原料的近红外光谱输入步骤(7)建立的热水可溶物含量定量预测模型,即可快速测定得到热水可溶物含量。2.根据权利要求1所述的方法,其特征在于:步骤(1)中,所述的烟叶原料样品形态包括粉末或8mm碎片,针对两类样品形态均直接进行近红外光谱采集和热水可溶物含量测定。3.根据权利要求2所述的方法,其特征在于:所述步骤(2)的近红外...

【专利技术属性】
技术研发人员:吴丽君段如敏王保兴白晓莉王颖琦杨德忠刘奇燕朱杰
申请(专利权)人:云南中烟工业有限责任公司
类型:发明
国别省市:云南,53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1