System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于双分类标记视觉Transformer的DOA估计方法技术_技高网

一种基于双分类标记视觉Transformer的DOA估计方法技术

技术编号:40381748 阅读:6 留言:0更新日期:2024-02-20 22:18
本发明专利技术提供一种基于双分类标记视觉Transformer的DOA估计方法,将DOA估计问题建模成非线性多分类问题,并通过DCT‑ViT模型来拟合这一非线性多分类问题,通过引入两个分类标签,更加高效地学习信号数据的特征以进一步提高DOA估计的精度;包括建立信号模型;数据预处理和打标签;DCT‑ViT的架构设计,数据集构建;相较于现有传统算法和深度学习方法,本发明专利技术提出的DCT‑ViT模型可以在低SNR场景下实现更好的DOA估计精度;在未被训练的高信噪比场景下,本发明专利技术提出的DCT‑ViT模型也可以实现比现有深度学习方法更好的DOA估计性能。此外,DCT‑ViT模型包含的可训练参数量也远少于现有CNN模型的可训练参数量,可进一步减少存储模型所占用的资源。

【技术实现步骤摘要】

本专利技术属于,尤其是一种基于双分类标记视觉transformer的doa估计方法。


技术介绍

1、doa(direction of arrival,波达方向)估计是一种确定信号来波方向的技术,通常应用于无线通信、雷达、声纳等领域;它通过分析阵列天线上接收的信号来确定信号源的到达角度,有助于定位目标或优化信号处理。

2、现有的基于深度学习低信噪比(signal-to-noise ratio,snr)的doa估计方法(papageorgiou g k,sellathurai m,eldar y c.deep networks for direction-of-arrival estimation in low snr[j].ieee transactions on signal processing,2021,69:3714-3729)通过构建深度网络模型,从接收信号的采样协方差矩阵中估计doa;在使用低snr场景下的信号协方差数据训练深度网络后,该网络能够实现比传统基于模型的doa估计方法更高的估计性能。

3、然而,上述方法存在一定的不足,具体表现为以下两点:

4、1、该方法采用的是卷积神经网络(cnn)这种较为传统的深度网络模型,与视觉transformer(vision transformer,vit)相比,cnn需要大量的参数和计算资源来构建深层的网络结构,而vit可以通过transformer的多头自注意力机制来实现更高效的特征提取和融合。

5、2、cnn难以捕捉网络输入(在本专利技术中是信号协方差矩阵构成的三通道张量)中的长距离依赖关系,而vit可以通过transformer的自注意力机制来建立输入张量中任意两个位置之间的联系。

6、3、在该方法所提出的深度网络模型中,只使用了4个卷积层和4个全连接层,网络结构较为简单;因此该方法的性能虽然优于传统的方法,但其doa估计的精度提升有限。

7、综上所述,设计新型神经网络模型以进一步提高低snr场景下的doa估计精度,提高不同场景下的doa估计鲁棒性成为一种前沿的发展趋势。


技术实现思路

1、为了解决上述技术问题,本专利技术提供了一种基于双分类标记视觉transformer的doa估计方法,通过基于双分类标记视觉transformer(dual class token visiontransformer,dct-vit)的低snr场景doa估计来实现;dct-vit模型包含了二维卷积层、transformer编码模块和全连接层,可以通过对不同snr条件下入射信号的采样协方差矩阵(sample covariance matrix,scm)数据进行充分学习,从而在相较于cnn有着更少可训练参数的前提下,进一步提高了低snr场景下的doa估计精度,并且在训练集未包含的snr和快拍数等条件下具有更好的doa估计鲁棒性。

2、一种基于双分类标记视觉transformer的doa估计方法,将doa估计问题建模成非线性多分类问题,并通过dct-vit模型来拟合这一非线性多分类问题,包括如下具体步骤:

3、步骤一、建立信号模型;

4、假设k个不相关的窄带远场信号sk(t)(k=1,2,…,k)以相同的波长λ由不同方向θ=[θ1,θ2,…,θk]入射至一个均匀线性阵列(ula),其中第k个入射信号的方向为θk;

5、作为一种举例说明,所述ula包括:n个全向的天线阵元,所述天线阵元间的间距为d,d=λ/2。

6、其中:λ表示信号波长;

7、在不失一般性的情况下,所述均匀线性阵列(ula)的第一个阵元被定义为参考,并设置在原点;因此,所述ula在时间t的接收信号可以被表述为:

8、x(t)=as(t)+n(t)                     ⑴

9、其中:s(t)=[s1(t),s2(t),…,sk(t)]t是信号源向量,[·]t代表向量或矩阵的转置;n(t)是均值为0、方差为的加性高斯白噪声向量;

10、定义所述ula的方向矩阵为:其中a(θk)对应着入射角度方向为θk导向矢量,并且可以被表示为:

11、

12、所述ula接收到的信号协方差矩阵的理论表达式为:

13、

14、作为一种举例说明,在实际应用中,所述协方差矩阵采用s个快拍数的采样协方差矩阵来近似,表示为:

15、

16、作为一种举例说明,所述均匀线性阵列(ula)是天线阵列中的一种。

17、步骤二、数据预处理和打标签;

18、①根据公式(1)-(4)可知,天线阵列可被视为一个非线性系统,所述天线阵列将空间域转换为接收信号的协方差矩阵,采用:g:θ→r表示;因此,需要神经网络通过学习未知的映射关系,进行从协方差矩阵到空间域的反映射,采用:ig:r→θ表示;即,网络输入y是与r相对应的矩阵或张量;

19、为了避免处理复值变量并充分利用接收到的信号的协方差信息,网络输入y被构造成一个维数为n×n×3的张量;

20、作为一种举例说明,所述输入y类似于图像,包含三个通道,分别为协方差矩阵r的:实部、虚部和相位项。

21、②将doa估计问题建模为一个多标签分类任务;

22、通过等角间隔△θ将空间域[θmin,θmax]划分为均匀网格

23、在训练阶段,输出向量zout中与输入张量中包含的角度相对应的元素被设为1,其余元素被设为0;

24、基于上述策略,训练数据集所述训练数据集包含有q个样本;

25、步骤三、dct-vit的架构设计;

26、dct-vit的架构包含:二维卷积层、多个transformer编码模块和多个全连接层;

27、transformer编码模块包括:多头自注意力层和多层感知机模块以及层归一化和随机路径丢弃;在每个随机路径丢弃操作之后都有一个残差连接;

28、输入y首先被传输进二维卷积层,然后进入批归一化层;二维卷积层包括维度为hc×hc的c个卷积核;这组图层的输出可以表示为:

29、

30、其中:p为横向或者纵向维度上的卷积核数量;

31、将yc的每个通道扁平化为维度为c的一维潜向量,得到一个由p2个向量组成的向量序列

32、在上述序列前后分别添加可学习的嵌入作为分类标记;

33、再将可学习的位置编码添加进补丁中,以保留位置信息,表示为:

34、

35、其中,是可训练的位置编码矩阵;由此生成的序列z0为transformer编码模块的输入;

36、transformer编码模块包括:le个串联的编码模块,每个编码模块包括:多头自注意力层、多层感知机模块、层归一化和随机路径丢弃;

37、作为一种举例说明,每个所述本文档来自技高网...

【技术保护点】

1.一种基于双分类标记视觉Transformer的DOA估计方法,将DOA估计问题建模成非线性多分类问题,并通过DCT-ViT模型来拟合这一非线性多分类问题,其特征在于,包括如下具体步骤:

2.根据权利要求1所述的一种基于双分类标记视觉Transformer的DOA估计方法,其特征在于,所述步骤一中建立信号模型的具体设置包括:

3.根据权利要求1所述的一种基于双分类标记视觉Transformer的DOA估计方法,其特征在于,所述Transformer编码模块包括:LE个串联的编码模块;每个编码模块包括:多头自注意力层、多层感知机模块、层归一化和随机路径丢弃;在每个随机路径丢弃操作之后都有一个残差连接;

4.根据权利要求1所述的一种基于双分类标记视觉Transformer的DOA估计方法,其特征在于,所述ULA包括:N个全向的天线阵元,所述天线阵元间的间距为d,d=λ/2,λ为信号波长。

5.根据权利要求1所述的一种基于双分类标记视觉Transformer的DOA估计方法,其特征在于,在实际应用中,所述协方差矩阵采用S个快拍数的采样协方差矩阵来近似,表示为:

6.根据权利要求1所述的一种基于双分类标记视觉Transformer的DOA估计方法,其特征在于,所述输入Y类似于图像,包含三个通道,分别为协方差矩阵R的:实部、虚部和相位项。

7.根据权利要求3所述的一种基于双分类标记视觉Transformer的DOA估计方法,其特征在于,

8.根据权利要求3所述的一种基于双分类标记视觉Transformer的DOA估计方法,其特征在于,每个所述多层感知机模块包括:若干的全连接层与随机失活层的组合,其中:每个全连接层的激活函数不完全一致,根据具体任务,其激活函数可以为高斯误差线性单元(Gaussian Error Linear Unit,GELU)、线性(Linear)函数、线性整流函数(RectifiedLinear Unit,ReLU)和指数线性单元(Exponential Linear Unit,ELU)具有相同作用的函数。

9.根据权利要求3所述的一种基于双分类标记视觉Transformer的DOA估计方法,其特征在于,所述二元交叉熵损失的定义为:

10.根据权利要求2所述的一种基于双分类标记视觉Transformer的DOA估计方法,其特征在于,所述均匀线性阵列是天线阵列中的一种。

...

【技术特征摘要】

1.一种基于双分类标记视觉transformer的doa估计方法,将doa估计问题建模成非线性多分类问题,并通过dct-vit模型来拟合这一非线性多分类问题,其特征在于,包括如下具体步骤:

2.根据权利要求1所述的一种基于双分类标记视觉transformer的doa估计方法,其特征在于,所述步骤一中建立信号模型的具体设置包括:

3.根据权利要求1所述的一种基于双分类标记视觉transformer的doa估计方法,其特征在于,所述transformer编码模块包括:le个串联的编码模块;每个编码模块包括:多头自注意力层、多层感知机模块、层归一化和随机路径丢弃;在每个随机路径丢弃操作之后都有一个残差连接;

4.根据权利要求1所述的一种基于双分类标记视觉transformer的doa估计方法,其特征在于,所述ula包括:n个全向的天线阵元,所述天线阵元间的间距为d,d=λ/2,λ为信号波长。

5.根据权利要求1所述的一种基于双分类标记视觉transformer的doa估计方法,其特征在于,在实际应用中,所述协方差矩阵采用s个快拍数的采样协方差矩阵来近似,表示为:

6.根据权利要求1所述的一种基...

【专利技术属性】
技术研发人员:张治郭宇黄育侦马楠张平
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1