一种基于注意力机制的太阳射电频谱图像爆发识别方法技术

技术编号:35563871 阅读:26 留言:0更新日期:2022-11-12 15:47
本发明专利技术公开了一种基于注意力机制的太阳射电频谱图像爆发识别方法,其基于子注意力机制和残差结构的射电频谱图像生成网络(R

【技术实现步骤摘要】
一种基于注意力机制的太阳射电频谱图像爆发识别方法


[0001]本专利技术属于太阳射电频谱图像处理
,具体涉及一种基于注意力机制的太阳射电频谱图像爆发识别方法。

技术介绍

[0002]太阳射电爆发是一种源自于太阳高能电子的无线电波信号,其辐射频率覆盖范围广,辐射强度大,并且射电数据携带着太阳爆发过程的粒子加速和辐射的相关物理信息,是认识日珥、日冕物质抛射、黑子、耀斑等太阳活动非常有效的工具,同时也是对空间和太阳物理研究非常有用的观测窗口。
[0003]全天候对太阳进行观测,产生了大量的观测数据,而其中包含太阳射电爆发事件的数据少之又少,同时由于原始数据受到观测设备通道噪声等因素的影响,导致人工无法快速分辨爆发数据和其他类型数据,这对后续展开天文学研究造成了一定的困难。
[0004]Ma等人提出了用于太阳射电爆分类的多模态学习(MDL)模型,在学习的联合表示的基础上,对太阳射电爆进行分类。实验结果表明,所提出的多模式学习网络能够有效地学习太阳射电谱的表示,提高分类精度。陈思思提出了一个基于卷积神经网络(CNN)的太阳射电频谱图分类算法,该网络采用了1*5和1*3卷积核代替了传统的卷积核,避免了通道之间的干扰,最终爆发频谱图像取得了84.6%的TPR值;徐龙等通过长短时记忆网络(LSTM)捕捉频谱图像的时序信息,并对原始的频谱图像进行了小波去噪和增强,使其图像特征更为突出,最终爆发频谱图像的分类TPR值达到了85.4%,开启了循环神经网络在该领域的应用;郑哲使用样本随机索引的方式解决了数据库中各类样本分布不平衡的问题,并在此基础上使用CNN将射电爆发频谱图像的分类TPR值提高到98.4%,但是其校准频谱图像的分类TPR却下降到除使用机器学习方法之外的最低分,仅为85.6%;
[0005]然而受太阳活动规律的影响,整个射电频谱样本基本上是以平静太阳活动时的“非爆发”频谱图像为主。因此整个射电频谱样本呈现数据量少,样本分布不均衡的特点。导致现有技术中的神经网络分类器不能完成适度的参数训练,找到最优的网络参数,限制了识别精度;另外,这些方法大多数是基于分类器结构的改进,而未考虑从样本数据分布不均匀,使得生成的图像质量和多样性受到影响。
[0006]因此,如何对观测到的数据进行自动处理和分类识别并对样本进行扩充,是目前亟待解决的问题。

技术实现思路

[0007]针对上述存在的问题,本专利技术提供一种基于注意力机制的太阳射电频谱图像爆发识别方法,基于改进生成对抗网络的数据增强方法来进行样本扩充并对传统生成对抗网络的生成器和判别器结构进行改进,提高网络训练过程的稳定性。
[0008]本专利技术的核心思路:为实现对太阳射电频谱图像的扩充,本专利技术提出了一种改进的生成对抗网络,不同于传统生成模型,该网络结构融合了注意力机制和残差结构,更符合
射电频谱图像特征,利用该结构可以生成样本丰富度和特征更加显著的频谱图像,也将更有利于分类模型对其进行识别。
[0009]实现本专利技术目的的技术解决方案为:
[0010]一种基于注意力机制的太阳射电频谱图像爆发识别方法,其特征在于,包括以下步骤:
[0011]步骤1:获取原始射电频谱数据;
[0012]步骤2:构建R

SAGAN生成网络对抗模型,利用原始射电频谱数据训练R

SAGAN生成网络对抗模型;
[0013]步骤3:基于训练好的R

SAGAN生成网络对抗模型对原始射电频谱数据进行数据增强,得到扩充后的射电频谱数据;
[0014]步骤4:将扩充后的射电频谱数据划分为训练数据集、测试数据集和验证数据集;
[0015]步骤5:利用训练数据集、测试数据集和验证数据集训练分类器,通过训练好的分类器进行原始射电频谱数据的识别,并输出识别结果。
[0016]进一步地,步骤2所述的R

SAGAN生成网络对抗模型训练步骤包括:
[0017]步骤21:从高斯分布中采样噪声信号作为模型生成器的输入,从原始射电频谱数据中采样真实样本作为模型判别器的输入,对判别器和生成器的模型参数进行初始化;
[0018]步骤22:将生成器输出的假样本与所采样的真实样本共同输入到判别器中,根据判别器的模型输出损失对判别器参数进行更新,期间生成器模型参数不变;
[0019]步骤23:保持判别器模型参数不变,根据生成器输出的样本损失对其参数进行更新。
[0020]进一步地,步骤2所述的R

SAGAN生成网络对抗模型包括生成器和判别器,生成器用于接收随机噪声z输入,并输出生成图像G(z);判别器用于判断输入图像x为真实图片的概率;
[0021]所述生成器包括依次相连的全连接层、第一残差单元、第一反卷积层、第二残差单元、第二反卷积层和第三反卷积层,所述全连接层用于进行reshape操作;所述第一残差单元和第二残差单元,用于对输入特征进行降维操作并减少模型参数引入;第一反卷积层和第二反卷积层的卷积核均为3*3,卷积步长为2,用于对图像进行上采样;第三反卷积层的卷积核为3*3,卷积步长为1,用于减少生成图像通道数;
[0022]所述判别器包括两个卷积核大小为3*3的卷积层以及两个多头注意力机制,每个多头注意力机制都有三个通道,每个通道都预先连接一个1*1的卷积来降低特征维度,并对三个通道的注意力计算结果进行拼接。
[0023]进一步地,所述第一残差单元和第二残差单元均包括三个依次连接的反卷积层和一个自注意力层,其中第一个反卷积层的卷积核为1*1卷积核,用于对输入特征进行降维操作同时减少模型参数的引入;第二个和第三个反卷积层的卷积核为3*3,卷积步长为1,用于等效填充,保证图像尺寸不发生变化;自注意力层用于对反卷积之后的特征图捕捉长距离的空间信息,使得有效特征得到增强。
[0024]进一步地,所述判别器的每个多头注意力机制之后还设置有Dropout系数,用于减轻判别器过拟合程度。
[0025]进一步地,所述判别器的激活函数采用Leaky ReLU函数。
[0026]本方法与现有技术相比,具有以下有益效果:
[0027]第一,本专利技术针对仿射变换和随机索引等传统少样本学习方法的固有缺陷和不足,提出了基于改进生成对抗网络的数据增强方法来进行样本扩充,该方法所生成图像的质量和多样性得到大幅提高;
[0028]第二,本专利技术对传统生成对抗网络的生成器和判别器结构进行了改进,在生成器中引入了自注意力层,对卷积层进行了补充,减轻了模型退化和梯度消失问题。将自注意力层和上采样层作为残差结构的一部分与输入特征进行了跳跃连接,减轻网络的退化程度,提高生成网络训练过程的稳定性。
附图说明
[0029]图1为传统生成对抗网络GAN的结构图;
[0030]图2为自注意力机制结构图;
[0031]图3(a)

(b)分别为本专利技术所提R

本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制的太阳射电频谱图像爆发识别方法,其特征在于,包括以下步骤:步骤1:获取原始射电频谱数据;步骤2:构建R

SAGAN生成网络对抗模型,利用原始射电频谱数据训练R

SAGAN生成网络对抗模型;步骤3:基于训练好的R

SAGAN生成网络对抗模型对原始射电频谱数据进行数据增强,得到扩充后的射电频谱数据;步骤4:将扩充后的射电频谱数据划分为训练数据集、测试数据集和验证数据集;步骤5:利用训练数据集、测试数据集和验证数据集训练分类器,通过训练好的分类器进行原始射电频谱数据的识别,并输出识别结果。2.根据权利要求1所述的一种基于注意力机制的太阳射电频谱图像爆发识别方法,其特征在于,步骤2所述的R

SAGAN生成网络对抗模型训练步骤包括:步骤21:从高斯分布中采样噪声信号作为模型生成器的输入,从原始射电频谱数据中采样真实样本作为模型判别器的输入,对判别器和生成器的模型参数进行初始化;步骤22:将生成器输出的假样本与所采样的真实样本共同输入到判别器中,根据判别器的模型输出损失对判别器参数进行更新,期间生成器模型参数不变;步骤23:保持判别器模型参数不变,根据生成器输出的样本损失对其参数进行更新。3.根据权利要求1所述的一种基于注意力机制的太阳射电频谱图像爆发识别方法,其特征在于,步骤2所述的R

SAGAN生成网络对抗模型包括生成器和判别器,生成器用于接收随机噪声z输入,并输出生成图像G(z...

【专利技术属性】
技术研发人员:郭军成万刚刘磊范爱民王帅贾玉童
申请(专利权)人:中国人民解放军战略支援部队航天工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1