基于生成式预训练Transformer的雷达信号脉冲描述字数据泛化方法技术

技术编号:45058581 阅读:30 留言:0更新日期:2025-04-22 17:41
本发明专利技术公开了一种基于生成式预训练Transformer的雷达信号脉冲描述字数据泛化方法,涉及数据处理技术领域,包括:获取PDW数据训练集,PDW数据训练集包括多个PDW数据样本,每个PDW数据样本包括多个特征;对PDW数据训练集进行预处理,并创建字典;对预处理后的PDW数据训练集进行分词化处理,得到符合语言模型处理要求的数据集;将符合语言模型处理要求的数据集输入至初始的语言模型进行训练,得到训练好的语言模型,训练好的语言模型根据符合语言模型处理要求的数据集,生成文本格式训练集;根据字典,将文本格式训练集解码,得到泛化扩充后的PDW数据训练集。本发明专利技术能够生成新的、多样化的脉冲描述字数据。

【技术实现步骤摘要】

本专利技术属于数据处理,具体涉及一种基于生成式预训练transformer的雷达信号脉冲描述字数据泛化方法。


技术介绍

1、日益复杂的电磁环境严重威胁了雷达辐射源识别准确率,基于深度学习的雷达辐射源分选方法严重依赖于预训练样本数据的数量和准确性,从数据生成质量层面增强对训练数据的泛化,是准确训练分类器,提高分类器准确分辨辐射源类型样式的能力的前提。因此,研究针对雷达信号pdw数据集的高质量泛化方法能够为分类模型质量提供保障,具有重要的应用价值。

2、目前对类似于pdw的离散数据的生成泛化主流方法主要有合成少数类过采样技术(smote)、生成对抗网络(gan)、变分自编码器(vaes)和扩散模型(ddpm)等。smote是一种常用于处理不平衡数据集的方法,通过插值生成新样本来增加少数类样本的数量。gan通过生成器和判别器的对抗训练生成高质量的样本。vaes利用编码器将输入数据压缩到潜在空间,再利用解码器从潜在空间重建输入数据来生成高质量样本。ddpm通过逐步添加噪声来破坏数据,然后学习逆过程以从噪声中重建数据生成高质量样本。然而现有技术中,利用生本文档来自技高网...

【技术保护点】

1.一种基于生成式预训练Transformer的雷达信号脉冲描述字数据泛化方法,其特征在于,包括:

2.根据权利要求1所述的基于生成式预训练Transformer的雷达信号脉冲描述字数据泛化方法,其特征在于,所述PDW数据样本至少包括到达方向、辐射源频率、脉冲宽度和脉冲幅度特征。

3.根据权利要求1所述的基于生成式预训练Transformer的雷达信号脉冲描述字数据泛化方法,其特征在于,所述对所述PDW数据训练集进行预处理,并创建字典,包括:

4.根据权利要求3所述的基于生成式预训练Transformer的雷达信号脉冲描述字数据泛化方法,其特征在于,所...

【技术特征摘要】

1.一种基于生成式预训练transformer的雷达信号脉冲描述字数据泛化方法,其特征在于,包括:

2.根据权利要求1所述的基于生成式预训练transformer的雷达信号脉冲描述字数据泛化方法,其特征在于,所述pdw数据样本至少包括到达方向、辐射源频率、脉冲宽度和脉冲幅度特征。

3.根据权利要求1所述的基于生成式预训练transformer的雷达信号脉冲描述字数据泛化方法,其特征在于,所述对所述pdw数据训练集进行预处理,并创建字典,包括:

4.根据权利要求3所述的基于生成式预训练transformer的雷达信号脉冲描述字数据泛化方法,其特征在于,所述字典包括特征对应的特征数据、整数标签和转换为字符串的映射关系。

5.根据权利要求1所述的基于生成式预训练transformer的雷达信号脉冲描述字数据泛化方法,...

【专利技术属性】
技术研发人员:任欢周峰龙禹东高荣星李浩森
申请(专利权)人:西安电子科技大学杭州研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1