一种自适应特征选择的电子鼻阵列优化方法技术

技术编号:35179941 阅读:17 留言:0更新日期:2022-10-12 17:48
本发明专利技术涉及一种自适应特征选择的电子鼻阵列优化方法,属于传感器技术领域。该方法包括以下步骤:S1:构建传感器响应数据集;S2:计算特征与类标签的归一化互信息;S3:将归一化互信息最高的特征加入已选特征集,从原始特征集中删除该特征;S4:计算特征的相关性、冗余性和互补性;S5:判断冗余性是否大于0;S6:若大于0,通过超参数优化评价函数;S7:若小于0,通过互信息计算评价分数;S8:将评价分数最高的特征加入已选特征集,从原始特征集中删除该特征,判断条件互信息是否小于阈值;S9:若小于阈值,停止遍历;S10:若大于阈值,继续遍历。本发明专利技术能够自动选择最优传感器组合,提升系统模式识别效果,更加符合现实场景下的应用。更加符合现实场景下的应用。

【技术实现步骤摘要】
一种自适应特征选择的电子鼻阵列优化方法


[0001]本专利技术属于传感器
,涉及一种自适应特征选择的电子鼻阵列优化方法。

技术介绍

[0002]电子鼻系统作为气体检测的有效工具之一,已广泛应用于环境监测、医疗诊断、食品安全等多个领域。由于电子鼻传感器阵列具有维数高、交叉敏感性强等特点,阵列优化是电子鼻系统的重要问题之一。不恰当的传感器组合会导致一些问题,包括选择性重叠、高计算开销、性能下降等。
[0003]为了获取更好的模式识别效果,往往采用特征选择的方法对传感器进行筛选。然而在优化过程中仍然存在一些未解决的问题,如自动确定最佳子集大小、采用贪婪搜索策略时的停止准则等。基于信息论的特征选择算法多依赖于相关性和冗余性,缺乏对互补性的考量,并且缺少贪婪搜索策略时的停止准则。目前广泛认可的停止准则是:特征子集与类标签的互信息值不再增加或达到最大值。该准则在低维空间有一定的适用性;但在高维空间中,由于很难确定残差项的大小,特征子集与类标签的互信息仍旧难以得到可靠的估计,该准则在传感器数量较多的阵列优化中效果并不理想。
[0004]本专利所公开的一种自适应特征选择的电子鼻阵列优化方法,基于惩罚冗余、奖励互补的原则,能够自动更新特征相关性、冗余性、互补性之间的权衡规则,同时采用基于多元矩阵Renyi熵泛函监测特征之间的条件互信息,自动确定最佳传感器阵列大小,选择最优传感器特征子集,在高维空间中具有一定的适用性。

技术实现思路

[0005]有鉴于此,本专利技术的目的在于提供一种自适应特征选择的电子鼻阵列优化方法。在该方法中,通过权衡传感器特征的相关性、冗余性和互补性,选择综合性能最高的特征;采用基于多元矩阵Renyi熵泛函监测特征之间的条件互信息,自动确定最优传感器个数,从而实现以最少的传感器个数获得最高的模式识别精度,提高电子鼻系统性能。
[0006]为达到上述目的,本专利技术提供如下技术方案:
[0007]一种自适应特征选择的电子鼻阵列优化方法,该方法具体包括以下步骤:
[0008]S1:获取传感器阵列在目标气体环境下的时间响应序列,建立传感器阵列的原始特征集;
[0009]S2:训练阵列优化模型,遍历传感器特征集合,计算每个特征与类标签之间的归一化互信息;
[0010]S3:将归一化互信息最高的特征加入已选特征子集,并从传感器特征集合中删除该特征;
[0011]S4:遍历传感器特征集合,计算特征与已选特征子集之间的相关性、冗余性和互补性;
[0012]S5:判断特征的冗余性是否大于0;
[0013]S6:若大于0,通过超参数优化评价函数;
[0014]S7:若小于0,特征的互信息值即为其评价分数;
[0015]S8:将评价分数最高的特征加入已选特征子集,并从传感器特征集合中删除该特征,判断当前条件互信息是否小于阈值;
[0016]S9:若小于阈值,则停止遍历,当前已选特征子集为最优特征子集;
[0017]S10:若大于阈值,则继续遍历。
[0018]进一步,在步骤S1中,所述原始特征集F具体包括:在一定的时间序列范围内,传感器在目标气体下响应的最大值。定义F为:
[0019]F={X1,X2,

,X
n
}
[0020]其中,n代表传感器的个数,每个特征X
i
(1≤i≤n)包含传感器在一定时间范围内不同样本下的响应值。定义X
i
为:
[0021][0022]其中,i代表传感器序号,j代表样本值,X为一个m维的向量,F为一个m
×
n的二维矩阵。
[0023]进一步,在步骤S2中,计算集合F中所有特征与类标签Y的归一化互信息SU(X
k
,Y)。定义SU(X
k
,Y)为:
[0024][0025]通过特征X
k
与类标签Y之间的归一化互信息能够较为公平地衡量传感器与目标气体之间的相关性。其中,类标签Y为离散值,代表不同的目标气体。归一化互信息SU(X
k
,Y)的范围为[0,1],当SU(X
k
,Y)=0时,特征X
k
与标签Y相互独立,即传感器k对识别目标气体帮助不大;当SU(X
k
,Y)=1时,特征X
k
与标签Y强相关,即传感器k是识别目标气体的重要元件。
[0026]进一步,在步骤S3中,将归一化互信息最高的特征X
max
加入已选特征子集S,并从特征集F中删除该特征,即
[0027]S=S∪X
max
[0028]F=F\X
max
[0029]其中,已选特征子集S在初始时为空集。
[0030]进一步,在步骤S4中,计算当前F中所有特征与已选特征子集S之间的相关性A(X
k
)、冗余性R(X
k
)和互补性C(X
k
)。相关性A(X
k
)定义为:
[0031]A(X
k
)=I(X
k
;Y)
[0032]通过候选特征与标签Y之间的互信息来衡量相关性。相关性A(X
k
)越大,则候选特征为类标签提供的信息越多,该传感器对识别目标气体的能力越强。冗余性R(X
k
)定义为:
[0033][0034]通过候选特征与已选特征子集S、标签Y的交互信息之和来衡量冗余性。当冗余性R(X
k
)≥0时,该候选特征与已选特征子集S存在冗余;当冗余性R(X
k
)<0时,该候选特征与已选特征子集S相互独立。互补性C(X
k
)定义为:
[0035][0036]通过已选特征子集S下,特征与类标签Y之间信息量的大小来衡量互补性。互补性C(X
k
)越大,则候选特征在已选特征子集基础上提供的信息越多,表明该传感器对识别目标气体性能越强。
[0037]进一步,在步骤S6中,若R(X
k
)≥0,通过超参数α、β优化评价函数J(X
k
)。评价函数J(X
k
)定义为:
[0038][0039]其中,表示特征的冗余比,表示候选特征与其他特征交互学习的能力,E(X
k
)为特征的方差。由于不断地向已选特征子集S中加入新的特征,已选特征子集S对目标气体的识别能力不断提高,此时集合F中的特征对于已选特征子集S的冗余性和互补性也在发生变化。通过α、β两个超参数调节评价函数,可以在动态变化中选出冗余更低、互补更高的特征。
[0040]进一步,在在步骤S7中,若R(X
k
)<0,特征的互信息值为其评价分数,即:
[0041]J(X
k
)=A(X
k
)
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自适应特征选择的电子鼻阵列优化方法,其特征在于:包括以下步骤:S1:获取传感器阵列在目标气体环境下的时间响应序列,建立传感器阵列的原始特征集;S2:训练阵列优化模型,遍历传感器特征集合,计算每个特征与类标签之间的归一化互信息;S3:将归一化互信息最高的特征加入已选特征子集,并从传感器特征集合中删除该特征;S4:遍历传感器特征集合,计算特征与已选特征子集之间的相关性、冗余性和互补性;S5:判断特征的冗余性是否大于0;S6:若大于0,通过超参数优化评价函数;S7:若小于0,特征与标签的互信息值即为其评价分数;S8:将评价分数最高的特征加入已选特征子集,并从传感器特征集合中删除该特征,判断当前条件互信息是否小于阈值;S9:若小于阈值,则停止遍历,当前已选特征子集为最优特征子集;S10:若大于阈值,则继续遍历。2.根据权利要求1所述的一种自适应特征选择的电子鼻阵列优化方法,其特征在于,在步骤S1中,所述原始特征集F具体包括:在一定的时间序列范围内,传感器在目标气体下响应的最大值。定义F为:F={X1,X2,

,X
n
}其中,n代表传感器的个数,每个特征X
i
(1≤i≤n)包含传感器在一定时间范围内不同样本下的响应最大值。定义X
i
为:其中,i代表传感器序号,j代表样本值,X为一个m维的向量,F为一个m
×
n的二维矩阵。3.根据权利要求1所述的一种自适应特征选择的电子鼻阵列优化方法,其特征在于,在步骤S2中,计算集合F中所有特征与类标签Y的归一化互信息SU(X
k
,Y)。定义SU(X
k
,Y)为:通过特征X
k
与类标签Y之间的归一化互信息衡量传感器与目标气体之间的相关性。其中,类标签Y为离散值,代表不同的目标气体。归一化互信息SU(X
k
,Y)的范围为[0,1],当SU(X
k
,Y)=0时,特征X
k
与标签Y相互独立,即传感器k对识别目标气体帮助不大;当SU(X
k
,Y)=1时,特征X
k
与标签Y强相关,即传感器k是识别目标气体的重要元件。4.根据权利要求1所述的一种自适应特征选择的电子鼻阵列优化方法,其特征在于,在步骤S3中,将归一化互信息SU(X
k
,Y)最高的特征X
max
加入已选特征子集S,并从特征集F中删除该特征,即S=S∪X
max
F=F\X
max
其中,已选特征子集S在初始时为空集。5.根据权利要求1所述的一种自适应特征选择的电子鼻阵列优化方法,其特征在于,在
步骤S4中,计算特征集合F中所有特征与已选特征子集S之间的相关性、冗余性和互补性。相关性A(X
k
)定义为:A(X
k
)=I(X
k
;Y)通过候选特征与类标签Y之间的互信息来衡量相关性。相关性A(X
k
)越大,候选特征为类标签提供的信息越多,该传感器对识别目标气体的能力越强。冗余性R(X
k
)定义为:通过候选特征与已选特征子集S、标签Y的交互信息之和来衡量冗余性。当R(X
k
)>0时,该候选特征与已选特征子集S存在冗余;当R(X
k
)≤0时,该候选特征与已选特征子集S相互独立。互补性C(X
k
)定义为:通过已选特征子集S下,特征与类标签Y之间信息量的大小来衡量互补性。互补性C(X
k
)越大,则候选特征在已选特征子集基础上提供的信息越多,表明该传感器对识别目标气体性能越强。6.根据权利要求1中所述的一种自适应特征选择的电子鼻阵列优化方法,其特征在于,在步骤S5中,判断特征的冗余性是否大于0。7.根据权利要求1中所述的一种自适应特征选择的电子鼻阵列优化方法,其特征在于,在步骤S6中,若R(X
k
)>0,则通过超参数...

【专利技术属性】
技术研发人员:陶洋张玉洁
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1