一种基于数据负增强与伪类原型点的电磁信号开集识别方法技术

技术编号:37718952 阅读:6 留言:0更新日期:2023-06-02 00:16
一种基于数据负增强与伪类原型点的电磁信号开集识别方法,包括:S1:将原始数据集按比例分为训练集和测试集;S2:确定训练所使用的K个已知类的类原型点以及一个伪类原型点的值,确定训练模型时的其他参数值;S3:将每一个样本输入神经网络编码器后得到特征向量,并计算特征向量与各原型点的距离得到距离向量;S4:得到特征向量和距离向量,再使用相似性筛选选择有效的负增强样本,S5:将之前获取的特征向量与距离向量输入损失函数计算损失,更新模型;S6:训练结束后,计算用于测试时的类原型点以及判别用阈值。本发明专利技术提高了模型的开放世界适应能力。适应能力。适应能力。

【技术实现步骤摘要】
一种基于数据负增强与伪类原型点的电磁信号开集识别方法


[0001]本专利技术涉及原型学习,数据增强,电磁调制信号识别,特别是涉及一种利用数据负增强与伪类原型点相结合来降低模型的开放世界风险的方法。

技术介绍

[0002]随着深度学习在模式识别领域取得较大进展,面向开放世界的电磁信号开集识别受到越来越多关注。电磁信号开集识别指的是通过机器学习的方法训练一个电磁信号分类模型,使其具有拒绝来自开放世界的未知类样本的能力,由此提高分类模型的泛化能力。现阶段的开集识别方法主要针对的是图像领域,针对电磁信号领域的很少。图像领域的开集识别方法主要包括判别式方法与生成式方法。判别式方法利用分类器自身的特性来识别未知类样本,生成式方法则借助额外生成的数据扩展原闭集分类器的功能。这些方法在图像领域能很好地运作,但是并不能完美适用于电磁信号领域。目前,电磁信号开集识别面临着两大难题:一是分类器不能有效识别出未知输入;二是分类器将已知类样本错分为未知类。我们将这两大难题统称为开放世界风险。
[0003]为有效应对开放世界风险,本专利技术利用数据负增强结合类原型学习的方式提高电磁信号分类模型的开集识别能力。其核心思想为在传统类原型学习的基础上增加伪类原型点来扩展模型的开放世界适应能力,并使用数据负增强的机制增强模型的适应能力。

技术实现思路

[0004]为了克服现有的应对开放世界风险的电磁信号开集识别方法较少的问题,本专利技术提供了一种基于数据负增强与伪类原型点的电磁信号开集识别方法。
[0005]本专利技术基于原型学习,并在此基础上构建额外的伪类原型点来扩展特征空间,初步增强模型的开放世界适应能力。本方法采用随机丢弃的负增强方法增强数据,通过相似性筛选选出合适的增强样本,再通过模型参数更新让分类器能正确地将增强样本引导至伪类原型点所在区域,进一步增强模型的开放世界适应能力。在保证闭集分类准确率不受影响的情况下,增强模型鉴别未知输入的能力。整个方法的训练框架如附图中的图1所示。
[0006]本专利技术解决其技术问题所采用的技术方案是:
[0007]一种基于数据负增强与伪类原型点的电磁信号开集识别方法,包括以下步骤:
[0008]S1:定义本方法的问题背景以及模型。将给定的由调制信号构成的训练集表示为其中输入样本为一段电磁调制信号,L是信号的长度,2表示该信号的I路和Q路;y
i
∈Y={1,2,...,K}是该信号的类别,K表示已知类的个数。然后,将电磁信号测试集表示为其中注意到测试集中多了第K+1类,我们将该类称作未知类,并将测试阶段的所有未知输入都视作第K+1类。我们将开集识别模型定义为是假设空间,X是所有输入样本所在的空间。最后,电磁信号开集识别的目标是降低如下经验风险:
[0009][0010]其中,表示期望,表示示性函数。
[0011]S2:初始化本方法的模型的类原型点。为了提高特征空间的分布的稳健性,我们在初始化时便确定每个类的类原型的位置,并在训练阶段保持不变。我们将这种方式所构建的类原型点称作类锚点。我们使用该思想,给每个已知类预设一个类原型点。为了增加模型应对开放世界风险的能力,额外增加了一个新的原型点,将其称作伪类原型点。于是,将第k类(将第K+1类的原型点视为伪原型点)的类原型点表示为并且,
[0012][0013]其中α是一个超参数,用于确定初始类原型点的位置。我们在训练过程不更新所有类原型点,而在训练结束后会再次使用训练样本更新已知类的类原型点,并保持伪类原型点的值不变。
[0014]S3:编码输入样本,获取特征向量和距离向量。我们将整个模型的神经网络编码器表示为其中表示开集识别模型的特征空间,d
z
是该特征空间的维度。通过将样本输入到中便可得到样本在特征空间中的特征向量使用欧式距离作为距离度量方式,并将距离计算函数表示为ξ。然后可以计算出特征向量到每个类锚点间的距离所构成的距离向量d,其中:
[0015][0016]然后使用softmin函数规范化距离向量,如下所示:
[0017][0018]S4:与此同时,我们对原输入样本进行增强,并将其编码后获取特征向量和距离向量。使用数据增强的目的是为了使用新的数据进一步调整特征空间的分布,尤其是潜在的未知输入的分布。我们将数据增强器表示为ψ,将增强后的数据表示为x
A
=ψ(x)。本方法采用随机丢弃的方式增强样本,其思路为,先拷贝原样本,如下:
[0019]x
A
=x (5)
[0020]然后,设置丢弃的点数为δ。在[0,L

1]中随机选取δ个不重复的值,并构成一个索引序列idx。随后按如下公式更新x
A

[0021][0022]新生成的样本通过相似性筛选后将用于更新模型。具体过程为,首先用编码器编码负增强样本,并计算距离向量:
[0023][0024]然后使用softmin函数规范化距离向量,再筛选符合如下规则的样本:
[0025][0026]其中,y为d
A
所对应的样本的类别;[:K]表示切片运算,也即取前K个元素并构成新向量;β
min
和β
max
是一个控制相似度的超参数。使用切片运算的目的是屏蔽伪原型点,以计算增强样本的特征向量是否与其对应的类原型保持一定相似性。
[0027]S5:使用改进的CAC距离损失函数更新模型参数。对于来自已知类的样本,其初步的损失函数可用如下方式计算:
[0028][0029]对于由相似性筛选保留下的增强样本,其初步的损失函数可用如下方式计算:
[0030][0031]此外,为了最小化类间距离,加入一个距离损失函数限制项,如下:
[0032][0033]最后每个样本的损失计算如下:
[0034][0035]其中ρ和λ是一个可调节的超参数。本方法将这两个参数都设置为0.1。
[0036]S6:训练结束后,便可计算用于测试时的类原型点以及判别用阈值。首先,在训练完成后,对于每个已知类,用该已知类的所有训练样本的特征向量的平均值作为该类的类原型。其次,我们选取所有被正确识别的已知类样本的mind的平均值作为基础阈值θ。最终,在测试时,对于一个测试样本x,通过编码器编码并得到距离向量d后,利用如下判决方式判断样本:
[0037][0038]整个方法的测试框架如附图的图2所示。
[0039]本专利技术的工作原理:首先,在传统原型学习的基础上增设额外的类原型点,由于该类原型点不参与后续测试,我们将称作伪类原型点。伪类原型点在特征空间中为未知类预留了一个新区域,使得在测试阶段,当遇到未知输入时,训练后的分类器能将未知输入映射到该新区域,而非已知类所在区域。其次,单纯设置伪类原型点还不够,因为若不让伪类原型点参与到模型的训练中,则在测试阶段模型也不会感知到伪类原型点的存在。因此使用数据负增强生成一批新样本,并让分类器认为这些数据是未知类样本,让这本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于数据负增强与伪类原型点的电磁信号开集识别方法,包括以下步骤:S1:定义的问题背景以及模型;S2:初始化的模型的类原型点;S3:编码输入样本,获取特征向量和距离向量;S4:对原输入样本进行增强,并将其编码后获取特征向量和距离向量;S5:使用改进的CAC距离损失函数更新模型参数;S6:训练结束后,计算用于测试时的类原型点以及判别用阈值。2.如权利要求1所述的一种基于数据负增强与伪类原型点的电磁信号开集识别方法,其特征在于,步骤S1具体包括:将给定的由调制信号构成的训练集表示为其中输入样本为一段电磁调制信号,L是信号的长度,2表示该信号的I路和Q路;y
i
∈Y={1,2,...,K}是该信号的类别,K表示已知类的个数;然后,将电磁信号测试集表示为其中注意到测试集中多了第K+1类,将该类称作未知类,并将测试阶段的所有未知输入都视作第K+1类;将开集识别模型定义为f:知类,并将测试阶段的所有未知输入都视作第K+1类;将开集识别模型定义为f:知类,并将测试阶段的所有未知输入都视作第K+1类;将开集识别模型定义为f:是假设空间,X是所有输入样本所在的空间;最后,电磁信号开集识别的目标是降低如下经验风险:其中,表示期望,表示示性函数。3.如权利要求1所述的一种基于数据负增强与伪类原型点的电磁信号开集识别方法,其特征在于,步骤S2具体包括:为了提高特征空间的分布的稳健性,在初始化时便确定每个类的类原型的位置,并在训练阶段保持不变;将这种方式所构建的类原型点称作类锚点;使用该思想,给每个已知类预设一个类原型点;为了增加模型应对开放世界风险的能力,额外增加了一个新的原型点,将其称作伪类原型点;于是,将第k类(将第K+1类的原型点视为伪原型点)的类原型点表示为并且,其中α是一个超参数,用于确定初始类原型点的位置;在训练过程不更新所有类原型点,而在训练结束后会再次使用训练样本更新已知类的类原型点,并保持伪类原型点的值不变。4.如权利要求1所述的一种基于数据负增强与伪类原型点的电磁信号开集识别方法,其特征在于,步骤S3具体包括:将整个模型的神经网络编码器表示为X

Z,其中表示开集识别模型的特征空间,d
z
是该特征空间的维度;通过将样本输入到中便可得到样本在特征空间中的特征向量使用欧式距离作...

【专利技术属性】
技术研发人员:徐东伟宋福星侯嘉烨宣琦杨小牛
申请(专利权)人:浙江工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1