一种基于近红外光谱的烟叶焦油解析方法技术

技术编号:37109049 阅读:14 留言:0更新日期:2023-04-01 05:07
本发明专利技术提供一种基于近红外光谱的烟叶焦油解析方法,该方法通过获取不同品种的成品烟丝样品,以及其相对应的近红外光谱信号,通过将数据标准化后运用LDA线性判别分析有监督模式识别,将焦油分成不同的种类,在不同种类中,运用最大距离差异化选择法选择80%的样品作为建模集,其他作为验证集,利用主成分分析与典型相关分析与多元线性回归相结合的方法构建近红外光谱与焦油之间的关联模型。本发明专利技术以焦油数据为基础,根据聚类原理,细化类别后最大化包含各个类别的样本量,使得整个建模过程中数据量的合理化来保证整个模型的精准度。是对卷烟企业目前精细化数据管理的有益补充和未来大数据需求提供精准的数据来源保障,同时为卷烟产品的开发以及卷烟产品质量的监控提供指导。供指导。供指导。

【技术实现步骤摘要】
一种基于近红外光谱的烟叶焦油解析方法


[0001]本专利技术涉及卷烟化学值检测
,特别涉及一种基于近红外光谱的烟叶焦油解析方法。

技术介绍

[0002]焦油是卷烟成品的一种重要致香物质,其是卷烟香气的重要组成部分之一;但是卷烟焦油在烟气的形成中也会对人体形成一定的危害,一般认为卷烟烟气中的有害成分主要集中在焦油中,国际上一般以焦油量的高低来评价卷烟的安全性,因此焦油检测在烟草成品的检测中起到非常重要而且必要的作用。
[0003]在传统的焦油检测中,一般采取抽烟机的检测形式;抽烟机检测一般耗时比较长,对卷烟质量的尤其是卷烟的安全性指标的评价比较滞后;更重要的是,在抽烟机的检测中,抽烟机的检测结果受卷烟滤嘴,卷烟滤纸等卷烟辅料的影响较大;近年来,近红外光谱由于其含有大量的化学成分信息,以及无损的分析技术作为一种快速的质量解析技术工具取得了广泛的应用,其在复烤厂的烟叶原料质量控制以及质量评价领域较为成熟,但在其分析焦油的检测却尚不成熟。鉴于上述情况,本专利技术旨在提供一种运用近红外光谱结合化学计量学方法对卷烟焦油的含量进行快速无损的检测以及评价的方式。

技术实现思路

[0004]鉴于传统的抽烟机检测方法的滞后性及外部辅料影响的缺点,本专利技术的目的在于提供一种基于近红外快速无损的焦油解析方法,为卷烟产品的开发以及卷烟产品质量的监控提供指导。
[0005]本专利技术所解决的问题可以使用以下技术方案来实现:
[0006]本专利技术提供一种基于近红外光谱的烟叶焦油解析方法,其特征在于,包括以下步骤:
[0007]步骤1,获取不同品种的成品烟丝样品,取该烟丝样品磨粉后进行近红外光谱扫描,获取对应的近红外光谱信息,并且获取抽烟机给出的焦油标准值数据;
[0008]步骤2,将对应的近红外光谱信息关联到抽烟机给出的焦油标准值数据,并建立焦油模型;
[0009]步骤3,运用LDA线性判别分析算法的有监督模式识别,将焦油光谱标准数据分成不同的类别;
[0010]步骤4,运用最大距离差异化选择法选择80%的样本数据作为建模集,剩余20%的样本数据作为验证集;
[0011]步骤5,通过半重数采样法、蒙特卡洛交叉验证进行奇异样本的剔除;
[0012]步骤6,通过一阶导数对光谱进行预处理;
[0013]步骤7,利用遗传算法对光谱波长进行筛选;
[0014]步骤8,利用主成分分析、典型相关分析、多元线性回归相结合构建近红外光谱与
焦油标准值之间的关联模型;
[0015]步骤9,利用步骤8的关联模型解析成品烟丝的焦油值:先对待测的成品烟丝磨粉后进行近红外光谱扫描,然后将获得的近红外光谱信息输入关联模型,则得出对应的焦油值。
[0016]进一步地,在本专利技术提供的基于近红外光谱的烟叶焦油解析方法中,还可以具有这样的特征:其中,步骤3具体包括如下步骤:
[0017]步骤3

1,输入样本光谱标准值数据集x:
[0018]x=(x1,x2,

,x
i


,x
n
),x
i
∈R
d
ꢀꢀꢀ
(1)
[0019]式(1)中,x表示样本光谱标准值数据集;x
i
表示光谱标准值数据集任意一个样本;R
d
表示R空间的d维度;
[0020]步骤3

2,将样本光谱标准值数据集x经过w变换后得到光谱标准值数据集T:
[0021][0022]w变换的变换规则如下:
[0023]T=w
H
x
ꢀꢀꢀꢀꢀꢀ
(3)
[0024]式(2)(3)中,T
i
表示变换后近红外光谱数据集T中的任意一个样本;表示变换后x
i
到新的维度w表示投影到的低维空间的维度为时对应的基向量;H表示转换过程中的导向量;
[0025]定义均值为中心点,并设X
k
为任意一个划分的类别C
k
的样本数据集,X
k
=(X1,X2,

,X
j


,X
N
),X
j
表示数据集任意一个样本,则该类别数据集的中心点为:
[0026][0027]式(4)中,N为类别C
k
中样本的总数,即X
j
的数目;
[0028]由于样本数据集X
k
经过w变换后得到据集T
k

[0029]T
k
=(T1,T,

,T
j

,T
N
)
ꢀꢀꢀ
(5)
[0030]则,中心点经过w变换后得到的中心点表示为:
[0031][0032]式(5)(6)中,即样本集X
k
的中心点的投影,也即X
k
中各元素投影后的均值;
[0033]步骤3

3,计算类内散度矩阵S
W

[0034]对于投影之后类别为C
k
的类内散列度为:
[0035][0036]将式(7)简化得到下式:
[0037]s
2k
=w
H
S
k
w
ꢀꢀꢀ
(8)
[0038]式(8)中,s
2k
表示类别为C
k
的类内散列度;S
k
表示类别为C
k
的类内散列度开根号;
[0039]式(8)仅表示类别C
k
的散列度,将所有类别的散列度相加则得到样本整体的类内
离散度:
[0040][0041]式(9)中,J
W
表示样本整体的类内离散度;k表示第k个样本类别,k的取值为1,2,

,c,样本类别总共划分为c类,第k个样本类别记为C
k

[0042]将式(9)简化得到下式:
[0043]J
W
=w
H
S
W
w
ꢀꢀ
(10)
[0044]式(10)中,S
W
为类内散度矩阵;
[0045]步骤3

4,计算类间散度矩阵S
A

[0046]①
假设只有两个类别时,两个类别样本数据集合分别为T
C1
,T
C2
,此时,两者的类间离散度J
A
为:
[0047][0048]式(11)中,表示样本数据集合T
C1
的中心点;表示样本数据集合T
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于近红外光谱的烟叶焦油解析方法,其特征在于,包括以下步骤:步骤1,获取不同品种的成品烟丝样品,取该烟丝样品磨粉后进行近红外光谱扫描,获取对应的近红外光谱信息,并且获取抽烟机给出的焦油标准值数据;步骤2,将对应的近红外光谱信息关联到抽烟机给出的焦油标准值数据,并建立焦油模型;步骤3,运用LDA线性判别分析算法的有监督模式识别,将焦油标准值数据分成不同的类别;步骤4,运用最大距离差异化选择法选择80%的样本数据作为建模集,剩余20%的样本数据作为验证集;步骤5,通过半重数采样法、蒙特卡洛交叉验证进行奇异样本的剔除;步骤6,通过一阶导数对光谱进行预处理;步骤7,利用遗传算法对光谱波长进行筛选;步骤8,利用主成分分析、典型相关分析、多元线性回归相结合构建近红外光谱与焦油标准值之间的关联模型;步骤9,利用步骤8的所述关联模型解析成品烟丝的焦油值:先对待测的成品烟丝磨粉后进行近红外光谱扫描,然后将获得的近红外光谱信息输入所述关联模型,测得对应的焦油值。2.根据权利要求1所述的一种基于近红外的烟叶焦油解析方法,其特征在于:其中,步骤3具体包括如下步骤:步骤3

1,输入样本数据集x:x=(x1,x2,

,x
i


,x
n
),x
i
∈R
d
ꢀꢀꢀ
(1)式(1)中,x表示样本数据集;x
i
表示数据集任意一个样本;R
d
表示R空间的d维度;步骤3

2,将样本数据集x经过w变换后得到据集T:所述w变换的变换规则如下:T=w
H
x
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)式(2)(3)中,T
i
表示变换后近红外光谱数据集T中的任意一个样本;表示变换后x
i
到新的维度w表示投影到的低维空间的维度为时对应的基向量;H表示转换过程中的导向量;定义均值为中心点,并设X
k
为任意一个划分的类别C
k
的样本数据集,X
k
=(X1,X2,

,X
j


,X
N
),X
j
表示数据集任意一个样本,则该类别数据集的中心点为:式(4)中,N为类别C
k
中样本的总数,即X
j
的数目;由于样本数据集X
k
经过w变换后得到据集T
k
:T
k
=(T1,T,

,T
j

,T
N
)
ꢀꢀꢀ
(5)
则,中心点经过w变换后得到的中心点表示为:式(5)(6)中,即样本集X
k
的中心点的投影,也即X
k
中各元素投影后的均值;步骤3

3,计算类内散度矩阵S
w
:对于投影之后类别为C
k
的类内散列度为:将式(7)简化得到下式:s
2k
=w
H
S
k
w
ꢀꢀꢀꢀ
(8)式(8)中,s
2k
表示类别为C
k
的类内散列度;S
k
表示类别为C
k
的类内散列度开根号;式(8)仅表示类别C
k
的散列度,将所有类别的散列度相加则得到样本整体的类内离散度:式(9)中,J
W
表示样本整体的类内离散度;k表示第k个样本类别,k的取值为1,2,

,c,样本类别总共划分为c类,第k个样本类别记为C
k
;将式(9)简化得到下式:J
W
=w
H
S
W
w
ꢀꢀ
(10)式(10)中,S
W
为类内散度矩阵;步骤3

4,计算类间散度矩阵S
A


假设只有两个类别时,两个类别样本数据集合分别为T
C1
,T
C2
,此时,两者的类间离散度J
A
为:式(11)中,表示样本数据集合T
C1
的中心点;表示样本数据集合T
C2
的中心点;将式(11)整理成只包含X的式子:令:则:J
A
=w
H
S
A
w
ꢀꢀꢀꢀꢀꢀ
(14)
式(12)(13)(14)中,表示类别样本数据集合T
C1
对应的未经w变换前的类别样本数据集合的中心点;表示类别样本数据集合T
C2
对应的未经w变换前的类别样本数据集合的中心点;S
A
为类间散度矩阵;

假设有多个类别时,类间离散度为:式(15)中,此时共有c(c

1)/2项的求和,时间复杂度为O(c2),),分别表示类别样本数据集合T
k
、T
m
的中心点;通过式(15),求得T
k
和T
m
的类间散度矩阵为:式(16)中,表示类别样本数据集合T
k
、T
m
的对应的未经w变换前的类别样本数据集合的中心点;定义样本数据集整体散度:式(17)中,S
H
表示样本数据集X...

【专利技术属性】
技术研发人员:詹映薛辰江沉石超彭云发邵俊何利波
申请(专利权)人:上海创和亿电子科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1