【技术实现步骤摘要】
基于生成对抗网络的电子鼻数据校正方法
[0001]本专利技术涉及传感器数据识别
,特别涉及一种电子鼻数据的校正方法。
技术介绍
[0002]传感器漂移是指在输入量不变的情况下,传感器输出量随着时间变化的现象。引起传感器漂移的一个原因是传感器老化、中毒或者环境波动等非主观因素,由此产生的传感器漂移数据集包括长期漂移集和短期漂移数据集。引起传感器漂移的一个原因是板间差异,即传感器及相应的硬件在制造时产生的偏差,由此产生的传感器漂移数据为板间差异数据集。除了时间漂移和板间漂移,更复杂的情况是传感器既存在时间漂移也存在板间漂移,由此产生的传感器漂移数据集为混合漂移数据集。
[0003]机器学习的默认假设是训练集和测试数据是独立同分布的。上述两个现象导致了现有的模型无法对产生漂移(传感器漂移和板间差异统称漂移)的数据进行准确分类。具体到电子鼻系统领域,传感器漂移是电子鼻系统不可规避的一个问题,电子鼻数据因时间漂移或板间差异导致了数据分布不一致,进而导致了数据集之间的类内非同质性,影响机器学习模型的分类准确率,进而限制了电子鼻系统的推广和应用。
技术实现思路
[0004]有鉴于此,本专利技术的目的是提供一种基于生成对抗网络的电子鼻数据校正方法,以解决传感器漂移问题导致电子数据分布不一致,进而导致了数据集之间的类内非同质性的技术问题。
[0005]本专利技术基于生成对抗网络的电子鼻数据校正方法包括以下步骤:
[0006]1)搭建命名为FEDA的神经网络,所述FEDA包括用于提取源域和目 ...
【技术保护点】
【技术特征摘要】
1.基于生成对抗网络的电子鼻数据校正方法,其特征在于:包括以下步骤:1)搭建命名为FEDA的神经网络,所述FEDA包括用于提取源域和目标域的域不变特征的特征提取器G
f
、用来区分数据来自源域和目标域的域判别器G
d
、用于计算域不变特征的L2范数损失的L2范数模块G
l
、用于数据类别的分类的标签分类器G
y
、用于计算类熵损失的类条件概率熵G
e
和用于进行梯度反转的梯度反转层,所述梯度反转层连接在特征提取器G
f
和域判别器G
d
之间;所述特征提取器G
f
的输出作为类条件概率熵G
e
,域判别器G
d
,L2范数模块G
l
,以及标签分类器G
y
的输入;数据分为标签丰富的源域和无标签的目标域,定义源域其中n
s
表示源域样本数量,表示源域的第i个样本,表示源域第i个样本的标签;其中n
t
表示源域样本数量,表示目标域第j个样本;源域数据的分布为P(X
s
,Y
s
),目标域数据分布为Q(X
t
,Y
t
),P≠Q;2)进行领域对抗训练:分别在特征提取器G
f
和域判别器G
d
上添加一个梯度反转层,首先在数据正向传播过程中训练特征提取器G
f
学习到域不变特征,从而让域判别器G
d
无法区分特征是来自源域和还是目标域,再通过最小化域分类损失L
d
来训练域判别器G
d
,使得域判别器G
d
可以区分源域和目标域特征;然后在数据反向传播经过梯度反转层的时候反转梯度,让特征提取器G
f
无法正确判断领域不变特征,以此完成对抗训练;在领域对抗训练过程中,计算特征提取器G
f
所提取特征的L2范数,并通过自适应的特征范数损失L
f
使得源域和目标域的L2范数在大范围上取得平衡;且类条件概率熵G
e
采用最小化目标域条件熵L
h
以减少目标域的类间重叠,增加类内同质性。2.根据权利要求1所述的基于生成对抗网络的电子鼻数据校正方法,其特征在于:在步骤2)中通过对抗损失L
d
来训练特征提取器G
f
学...
【专利技术属性】
技术研发人员:刘然,陈希,毛虎,田逢春,钱君辉,崔珊珊,王斐斐,陈丹,陈鑫,任席伟,王仕丹,
申请(专利权)人:勒威半导体技术嘉兴有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。