一种基于域自适应的极限学习机传感器漂移数据重构方法技术

技术编号:34835642 阅读:21 留言:0更新日期:2022-09-08 07:30
本发明专利技术提出一种基于域自适应的极限学习机传感器漂移数据重构方法,该方法先设计一个子空间学习策略,该策略能够自适应对输入的数据做出不同的学习行为。若数据来自源域数据集,建立ELM特征学习映射,保证输出目标数据域输入目标数据之间的差值最小,进而保证源域样本类别信息基本保留,而无需降维处理;若数据来自目标域数据集,建立ELM特征学习映射,使用无参数MMD作为差异度量函数,保证映射后的源域数据与目标域数据尽可能相似。最后将重构后的目标域数据与源域数据分别作为自适应ELM分类器的测试数据集与训练数据集,最后得出训练模型的分类预测精度。本发明专利技术的优点在于利用ELM训练速度快、且不需要更新,学习过程只需要计算输出权值等优点,实现对域数据的快速重构,解决传感器漂移/偏移问题,进而提高电子鼻系统的预测精度。系统的预测精度。

【技术实现步骤摘要】
一种基于域自适应的极限学习机传感器漂移数据重构方法


[0001]一种基于域自适应的极限学习机传感器漂移数据重构方法。

技术介绍

[0002]电子鼻,又称人工嗅觉仿生系统,是一种具有智能信号处理和模式识别单元的交叉敏感气体传感器阵列,在环境监测、医疗诊断、食品工程等领域具有广泛的应用前景。然而,由于传感器漂移和多设备间信号偏移的存在,已经限制了电子鼻大规模的应用。
[0003]传感器漂移是气体传感器定量特性的缓慢变化,其值本应该保持恒定不变。但是,由于传感器都存在老化和中毒的可能,且系统和环境变化之间的差异,比如温度、湿度等,都将引起测量的数据偏离真实的气体物理值。对于一个单一的电子鼻系统,传感器的响应将在同一气体环境下的较长时间(一年或者更长)内发生较大的变化(时变漂移)。因此,在模型迁移过程中,使用传感器漂移之前收集的数据集训练的模式识别系统性能将大大降低。为确保模式识别系统的预测性能,则需要频繁的重新校准。然而,电子鼻的重新校准是费时费力的,所以频繁的校准并不是一种可取的办法。
[0004]同一时间段多个同类型电子鼻设备之间的输出差异被称为信号偏移,这是由于相同仪器的重现性较弱造成的。气体传感器的制造技术和多个系统之间的不可控差异,当多个相同的电子鼻设备在相同的气体环境下运行时,电子鼻系统的响应是不同的。当多个配置相同的电子鼻系统来检测和识别气体时,由于信号偏移的影响,当使用一个设备(主设备)上训练的模型直接预测来自另一个设备(从设备)的数据时,模型预测精度会有所下降。因此,利用每个设备收集的气体样本来建立一个预测模型通常是不切实际的,尤其是在样本收集的成本很高的情况下。故在仪器之间的校准是有必要的。
[0005]在实际应用中,由于传感器漂移/偏移的不可预测性和不确定性,使得电子鼻的普及更加举步维艰。解决传感器漂移/偏移问题也成为众多研究者关注的热点问题。该问题的解决势必会带来巨大的间接经济效应。电子鼻具有便携性、检测精度高、灵敏性等特点,也将促使电子鼻越来越受到人们的欢迎。

技术实现思路

[0006]本专利技术提出了一种基于域自适应的极限学习机传感器漂移数据重构方法,实现对传感数据的重构。该方法可以有区别地处理来自两个不同域的数据,其关键在于学习一个域不变空间来最小化源域和目标域之间的分布差异。
[0007]本专利技术提供如下技术方案,包括如下步骤:
[0008]步骤1:设计一个子空间学习策略;
[0009]步骤2:建立ELM1模型,通过学习最佳输出权值β
*
来保留有用类别信息;
[0010]步骤3:建立ELM2模型,通过学习最佳输出权值β
*
降低不同域之间的重构差异;
[0011]步骤4:建立自适应ELM分类器,验证重构数据的分布一致性和域可迁移性。
[0012]在步骤1设计子空间学习策略,以数据为输入,并根据数据域实现不同的学习行
为:若数据为源域执行步骤2;若数据为目标域执行步骤3。
[0013]在步骤2中建立ELM1特征学习模型,根据最小二乘法原理,将输出目标数据与输入目标数据的差值定义为信息损失函数,从而使得源域样本类别信息基本保持固定,而无需降维。换而言之,通过步骤2建立的学习模型,能够最大可能的保留源域的判别信息,且重构后的数据不扭曲。
[0014]在步骤3建立ELM2特征学习模型,使用无参数MMD作为差异度量函数,保证源域重构后的数据与目标域重构后的数据尽可能相似。
[0015]在步骤4建立自适应ELM分类器,使用源域重构的数据作为模型训练数据集,目标域数据作为模型测试数据集,进而验证重构方法的可行性。
[0016]本专利技术的现实意义,本方法充分使用了ELM训练速度快,网络简单,且不需要更新,学习过程只需要计算输出权值等优点,大大提高了算法的计算效率。且该方法是无监督的学习方法,避免了需要访问感兴趣领域的数据标签,这是一个费力且昂贵的过程,更接近实际应用场景。
附图说明
[0017]为了使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术作进一步的详细描述,其中:
[0018]图1为传感器数据重构方法专利技术流程图。
具体实施方式
[0019]下面将结合附图,对本专利技术的实施例进行详细的描述。
[0020]本专利技术提供了一种基于域自适应的极限学习机传感器漂移数据重构方法,如图1所示该方法包括以下步骤:
[0021]步骤1:设计子空间学习策略,输入不同的数据及参数;
[0022]步骤2:建立ELM1模型,通过学习最佳输出权值β
*
来保留有用类别信息;
[0023]步骤3:建立ELM2模型,通过学习最佳输出权值β
*
降低不同域之间的重构差异;
[0024]步骤4:建立自适应ELM分类器,验证重构数据的分布一致性和域的可迁移性。
[0025]在步骤1中设计子空间学习策略,数据作为输入,该策略可以根据不同数据域实现不同的学习行为:若数据来自源域,则将执行步骤2;若数据来自目标域,则将执行步骤3;
[0026]在步骤2中建立ELM1学习模型,根据最小二乘法原理,使得重构后的源域数据与重构前的源域数据差值最小,即重构后误差最小。通过这种方式,可以保持源域数据尽可能保持不变,解决了源域信息保留问题。其源域信息损失定义如公式(1)所示:
[0027][0028]其中f(
·
)指的是一个极限学习机的学习映射过程。
[0029]在步骤3中建立ELM2学习模型,分别对源域数据和目标域数据进行重构,然后使用非参数MMD作为差异度量函数,重构分布差异如公式(2)所示:
[0030]CD(f(X
S
),f(X
T
))=MMD2(f(X
S
),f(X
T
))
ꢀꢀꢀ
(2)
[0031]综合公式(1)与公式(2),可以得出模型目标函数,目标函数如公式3所示:
[0032][0033]因为f(
·
)是一个极限学习机的学习过程,旨在找到隐藏层的输出权值β
*
,故模型目标函数可重写,如公式4所示:
[0034][0035]在步骤4中,建立ELM分类器模型,使用重构后的源域数据作为该模型的训练数据集,重构后的目标域数据作为测试数据集。自适应极限学习机分类器的基本思想如公式(5)所示:
[0036][0037]通过将约束项代入目标函数,可以将上述优化问题转化为非约束形式,上述公式可重写,如公式(6)所示:
[0038][0039]其中H表示隐藏层的输出矩阵。表示F范数的操作符。
[0040]在实验中,采用了来自UCSD的多个电子鼻系统采集的数据,目的是研究DR

ELM在具有相同配置的多个电子鼻设备之间的传感器漂移抑制能力。旨在通过一个电子鼻装置采集的样本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于域自适应的极限学习机传感器漂移数据重构方法,其特征在于,包括以下步骤:步骤1:设计一个子空间学习策略;步骤2:建立ELM1模型,通过学习最佳输出权值β
*
来保留有用类别信息;步骤3:建立ELM2模型,通过学习最佳输出权值β
*
降低不同域之间的重构差异;步骤4:计建立自适应ELM分类器,验证重构数据的分布一致性和域可迁移性。2.如权利要求1所述的一种基于域自适应的极限学习机传感器漂移数据重构方法,其特征在于:在步骤1设计子空间学习策略,以数据为输入,并根据数据域实现不同的学习行为:若数据为源域执行步骤2;若数据为目标域执行步骤3。3.如权利要求1所述的一种基于域自适应的极限学习机传感器漂移数据重构方法,其特征在于:...

【专利技术属性】
技术研发人员:陶洋吴鹏
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1