【技术实现步骤摘要】
一种基于孪生卷积自编码器构建的光谱模型转移方法
[0001]本专利技术属于烟草近红外光谱模型转移
,具体涉及一种基于孪生卷积自编码器构建的光谱模型转移方法
。
技术介绍
[0002]近红外光谱技术作为一种成分分析方法,具有低成本
、
无损
、
无污染
、
快速高效等优点,被广泛应用于烟草行业
。
然而在实际应用中,即使同一个厂家同一个型号的两台近红外光谱仪器,由于环境不同
、
仪器零部件的差异等原因,会导致仪器间测量出的光谱存在差异
。
由于建立光谱模型需要投入大量的人力
、
物力,花费巨大,如果将已经建立的模型应用于其他仪器,那么不仅节约大量的人力
、
物力,而且对于实现模型的共享,提高模型的通用性
、
适用性具有重要的意义
。
[0003]近年来,深度学习技术凭借其学习能力强
、
适应性好
、
上限高
、 />可移植性好等优点本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.
一种基于孪生卷积自编码器构建的光谱模型转移方法,其特征在于,包括如下步骤:
S1
:获取源机与从机的近红外光谱;
S2
:将
S1
获取的近红外光谱进行数据集随机划分,划分为训练集和测试集,训练集和测试集均有源机和从机近红外光谱;
S3
:使用误差椭圆法分别剔除训练集和测试集中的源机和从机近红外光谱中的异常数据;
S4
:分别对
S3
得到的训练集和测试集中源机以及从机的近红外光谱进行预处理;
S5
:设计基于卷积自编码器的孪生编码器
A
和
B
;采用
S4
得到的训练集中从机的近红外光谱训练孪生编码器
A
;采用
S4
得到的训练集中源机的近红外光谱训练孪生编码器
B
;
S6
:设计基于
S5
所述孪生编码器
A
和孪生编码器
B
的转移模型
C
;
S7
:使用
S4
得到的训练集中源机和从机的近红外光谱训练
S6
的转移模型
C
;
S8
:采用
S4
得到的测试集中源机和从机的近红外光谱评估转移模型
C
,检验光谱转移效果
。2.
根据权利要求1所述的基于孪生卷积自编码器构建的光谱模型转移方法,其特征在于,
S1
中获取源机与从机的近红外光谱时,每条源机的近红外光谱和从机的近红外光谱均从相同的烟叶样本分别用源机与从机扫描得到
。3.
根据权利要求1所述的基于孪生卷积自编码器构建的光谱模型转移方法,其特征在于,
S3
中所述误差椭圆法包括如下步骤:
S31
:使用主成分分析方法,分别将训练集和测试集中的源机以及从机的近红外光谱进行降维,只保留两个主成分,并分别计算降维后训练集和测试集中源机的近红外光谱以及训练集和测试集中从机的近红外光谱的均值和两个主成分的标准差,并据此分别确定训练集和测试集中源机的近红外光谱的误差椭圆以及训练集和测试集中从机的近红外光谱对应的误差椭圆;
S32
:分别对
S31
降维后训练集和测试集中源机近红外光谱以及从机的近红外光谱计算其
T2统计量,由此判断出训练集和测试集中的离群点,并将其从训练集和测试集中剔除;所述
T2统计量用于发现样本点中的离群点
。4.
根据权利要求3所述的基于孪生卷积自编码器构建的光谱模型转移方法,其特征在于,
S32
中
T2统计量发现样本点中的离群点的具体原理为:定义第
i
个样本点对第
h
主成分
t
h
的贡献率为,公式如下:(1)其中,是第
i
个样本点的第
h
主成分,是主成分
t
h
的方差,
n
是样本总数;通过公式(1)可计算样本点
i
对主成分的累计贡献率,公式如下:(2)其中,是第
i
个样本点的第
h
主成分,是主成分
t
h
的方差,
n
是样本点个数;当:(3)时,认为在
95%
的检验水平上,样本点
i
对主成分的贡献过大,此时所述样本点
i
是离群点;其中,
n
是样本点个数;
m
为主成分数;为累计贡献率;
F
0.05
(m,m
‑
n)
为检验水平
α = 0.05
,分子自由度为
m
,分母自由度为 n
‑
m 的
F
分布的单侧右分位点,通过查询
F
分布的
F
界值表得到;当
m
为2时,即主成分数为2时,将
m = 2
带入公式(3)可得到如下公式:(4)其中, t
1i
是第
i
个样本点的第1主成分; t
2i
是第
i
个样本点的第2主成分;
ꢀꢀ
是主成分
t1的方差; 是主成分
t2的方差;
n
是样本点个数;
c
为
T2统计量;公式(4)符合椭圆方程构造,在光谱样本的第一主成分和第二主成分平面图上表示的是一个椭圆,样本点落在在椭圆内为正常样本,落在椭圆外为离群样本
。5.
根据权利要求1所述的基于孪生卷积自编码器构建的光谱模型转移方法,其特征在于,
S4
所述预处理包括如下步骤:
S41
:分别对
S3
得到的训练集和测试集中源机以及从机的近红外光谱增加波长点,其吸光度与波长点保持一致;
S42
:通过
Savitzky
‑
Golay
平滑滤波器分别对增加了波长点后的源机的近红外光谱和从机的近红外光谱求其一阶导数;
S43
:对训练集和测试集中源机的近红外光谱
、
从机近红外光谱一阶导数
、
训练集和测试集中从机的近红外光谱和从机近红外光谱一阶导数进行标准差标准化,其计算公式如下所示:(5)其中,
x
ij
为实际变量值;
x
i
为各变量的平均值;
s
i
为各变量的标准差;
Z
ij
为标准化后的变量值
。6.
根据权利要求1所述的基于孪生卷积自编码器构建的光谱模型转移方法,其特征在于,
S5
中设计基于卷积自编码器的孪生编码器的步骤如下:
S51
:构建卷积池化块,其结构为一维卷积
‑
LeakyReLU
激活函数
‑
一维平均池化;
S52
:构建转置卷积块,其结构为一维转置卷积层
‑
LeakyReLU
激活函数;
S53
:构建编码器,其结构为输入层
‑
高斯噪音
‑
卷积池化层块一
‑
卷积池化层块二
‑
卷积池化层块三
‑
【专利技术属性】
技术研发人员:吴箭,杨泽会,郝贤伟,徐元飞,李瑞东,吕小芳,毕一鸣,张志成,李卫星,徐梦瑶,张建,王昕,吴灵通,王宇敏,招云芳,付涛,李正莹,张恺,夏春艳,朱剑波,夏自麟,夏丹,
申请(专利权)人:云南烟叶复烤有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。