基于生成对抗网络的电子鼻数据校正方法技术

技术编号:33460494 阅读:13 留言:0更新日期:2022-05-19 00:41
本发明专利技术基于生成对抗网络的电子鼻数据校正方法,其包括1)搭建命名为FEDA的神经网络,2)进行领域对抗训练:分别在特征提取器G

【技术实现步骤摘要】
基于生成对抗网络的电子鼻数据校正方法


[0001]本专利技术涉及传感器数据识别
,特别涉及一种电子鼻数据的校正方法。

技术介绍

[0002]传感器漂移是指在输入量不变的情况下,传感器输出量随着时间变化的现象。引起传感器漂移的一个原因是传感器老化、中毒或者环境波动等非主观因素,由此产生的传感器漂移数据集包括长期漂移集和短期漂移数据集。引起传感器漂移的一个原因是板间差异,即传感器及相应的硬件在制造时产生的偏差,由此产生的传感器漂移数据为板间差异数据集。除了时间漂移和板间漂移,更复杂的情况是传感器既存在时间漂移也存在板间漂移,由此产生的传感器漂移数据集为混合漂移数据集。
[0003]机器学习的默认假设是训练集和测试数据是独立同分布的。上述两个现象导致了现有的模型无法对产生漂移(传感器漂移和板间差异统称漂移)的数据进行准确分类。具体到电子鼻系统领域,传感器漂移是电子鼻系统不可规避的一个问题,电子鼻数据因时间漂移或板间差异导致了数据分布不一致,进而导致了数据集之间的类内非同质性,影响机器学习模型的分类准确率,进而限制了电子鼻系统的推广和应用。

技术实现思路

[0004]有鉴于此,本专利技术的目的是提供一种基于生成对抗网络的电子鼻数据校正方法,以解决传感器漂移问题导致电子数据分布不一致,进而导致了数据集之间的类内非同质性的技术问题。
[0005]本专利技术基于生成对抗网络的电子鼻数据校正方法包括以下步骤:
[0006]1)搭建命名为FEDA的神经网络,所述FEDA包括用于提取源域和目标域的域不变特征的特征提取器G
f
、用来区分数据来自源域和目标域的域判别器G
d
、用于计算域不变特征的L2范数损失的L2范数模块G
l
、用于数据类别的分类的标签分类器G
y
、用于计算类熵损失的类条件概率熵G
e
和用于进行梯度反转的梯度反转层,所述梯度反转层连接在特征提取器G
f
和域判别器G
d
之间,
[0007]所述特征提取器G
f
的输出作为类条件概率熵G
e
,域判别器G
d
,L2范数模块G
l
,以及标签分类器G
y
的输入;把数据分为标签丰富的源域和无标签的目标域,定义源域其中n
s
表示源域样本数量,表示源域的第i个样本,表示源域第i个样本的标签;其中n
t
表示源域样本数量,表示目标域第j个样本;源域数据的分布为P(X
s
,Y
s
),目标域数据分布为Q(X
t
,Y
t
),P≠Q;
[0008]2)进行领域对抗训练:分别在特征提取器G
f
和域判别器G
d
上添加一个梯度反转层,首先在数据正向传播过程中训练特征提取器G
f
学习到域不变特征,从而让域判别器G
d
无法区分特征是来自源域和还是目标域,再通过最小化域分类损失L
d
来训练域判别器G
d
,使得域判别器G
d
可以区分源域和目标域特征;然后在数据反向传播经过梯度反转层的时候反转梯度,让特征提取器G
f
无法正确判断领域不变特征,以此完成对抗训练;
[0009]在领域对抗训练过程中,计算特征提取器G
f
所提取特征的L2范数,并通过自适应的特征范数损失L
f
使得源域和目标域的L2范数在大范围上取得平衡;且类条件概率熵G
e
采用最小化目标域条件熵L
h
以减少目标域的类间重叠,增加类内同质性。
[0010]进一步,在步骤2)中通过对抗损失L
d
来训练特征提取器G
f
学习域不变特征,对抗损失L
d
表述如下:
[0011][0012]其中X
s
,X
t
表示源域和目标域,表示源域的第i个样本,表示目标域第j个样本。
[0013]进一步,在步骤2)中梯度反转层反转L
d
的梯度是把梯度替换为其中σ表示权重参数;把梯度反转层的伪函数定义为R
σ
(x),则梯度反转表示为如下两个函数:
[0014][0015]其中I表示单位矩阵。
[0016]进一步,步骤2)中所述自适应的特征范数损失是通过最大均特征分布差异的方式构造得到,构造步骤包括:
[0017]定义源域和目标域的最大平均特征分布差异如下:
[0018][0019]其中MMFDD[G
f
,X
s
,X
t
]为最大平均特征分布差;x
i
,x
j
分别表示源域和目标域的数据。
[0020]构造一个距离Z来拟合源域和目标域之间的特征范数差距L
Z
,使源域和目标域的L2范数分别收敛到Z,从而使得MMFDD[G
f
,D
s
,D
t
]最小,
[0021][0022]再构造自适应的特征范数损失L
f
,公式如下,
[0023][0024]其中Δz表示残差特征范数,w
g
表示权重参数。
[0025]进一步,在步骤2)中最小化目标域条件熵L
h
的公式如下,
[0026][0027]其中C表示类别数量,表示目标域第k类的预测概率,w
e
表示权重参数。
[0028]进一步,所述的基于生成对抗网络的电子鼻数据校正方法还包括优化反向传播,
优化目标为:
[0029][0030]其中θ
f

y

d
分别表示G
f
,G
y
,G
d
的参数,α,β,γ分别表示权重参数;的参数,α,β,γ分别表示权重参数;分别表示θ
f

y

d
的最优参数;L
y
为用于引导特征提取器G
f
和标签分类器G
y
做出正确的类别预测的交叉熵损失,在源域上L
y
表示为:
[0031][0032]本专利技术的有益效果:
[0033]本专利技术基于生成对抗网络的电子鼻数据校正方法,降低了源域和目标域的分布差异,增加了类内同质性,解决电子鼻数据的域适应问题,能提高对传感器漂移数据集的分类正确率。
附图说明
[0034]图1是FEDA神经网络的整体框架图。
具体实施方式
[0035]下面结合附图和实施例对本专利技术作进一步描述。
[0036本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于生成对抗网络的电子鼻数据校正方法,其特征在于:包括以下步骤:1)搭建命名为FEDA的神经网络,所述FEDA包括用于提取源域和目标域的域不变特征的特征提取器G
f
、用来区分数据来自源域和目标域的域判别器G
d
、用于计算域不变特征的L2范数损失的L2范数模块G
l
、用于数据类别的分类的标签分类器G
y
、用于计算类熵损失的类条件概率熵G
e
和用于进行梯度反转的梯度反转层,所述梯度反转层连接在特征提取器G
f
和域判别器G
d
之间;所述特征提取器G
f
的输出作为类条件概率熵G
e
,域判别器G
d
,L2范数模块G
l
,以及标签分类器G
y
的输入;数据分为标签丰富的源域和无标签的目标域,定义源域其中n
s
表示源域样本数量,表示源域的第i个样本,表示源域第i个样本的标签;其中n
t
表示源域样本数量,表示目标域第j个样本;源域数据的分布为P(X
s
,Y
s
),目标域数据分布为Q(X
t
,Y
t
),P≠Q;2)进行领域对抗训练:分别在特征提取器G
f
和域判别器G
d
上添加一个梯度反转层,首先在数据正向传播过程中训练特征提取器G
f
学习到域不变特征,从而让域判别器G
d
无法区分特征是来自源域和还是目标域,再通过最小化域分类损失L
d
来训练域判别器G
d
,使得域判别器G
d
可以区分源域和目标域特征;然后在数据反向传播经过梯度反转层的时候反转梯度,让特征提取器G
f
无法正确判断领域不变特征,以此完成对抗训练;在领域对抗训练过程中,计算特征提取器G
f
所提取特征的L2范数,并通过自适应的特征范数损失L
f
使得源域和目标域的L2范数在大范围上取得平衡;且类条件概率熵G
e
采用最小化目标域条件熵L
h
以减少目标域的类间重叠,增加类内同质性。2.根据权利要求1所述的基于生成对抗网络的电子鼻数据校正方法,其特征在于:在步骤2)中通过对抗损失L
d
来训练特征提取器G
f
学...

【专利技术属性】
技术研发人员:刘然陈希毛虎田逢春钱君辉崔珊珊王斐斐陈丹陈鑫任席伟王仕丹
申请(专利权)人:勒威半导体技术嘉兴有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1