一种基于双分类标记视觉Transformer的DOA估计方法技术

技术编号：40381748 阅读：6 留言：0更新日期：2024-02-20 22:18

本发明专利技术提供一种基于双分类标记视觉Transformer的DOA估计方法，将DOA估计问题建模成非线性多分类问题，并通过DCT‑ViT模型来拟合这一非线性多分类问题，通过引入两个分类标签，更加高效地学习信号数据的特征以进一步提高DOA估计的精度；包括建立信号模型；数据预处理和打标签；DCT‑ViT的架构设计，数据集构建；相较于现有传统算法和深度学习方法，本发明专利技术提出的DCT‑ViT模型可以在低SNR场景下实现更好的DOA估计精度；在未被训练的高信噪比场景下，本发明专利技术提出的DCT‑ViT模型也可以实现比现有深度学习方法更好的DOA估计性能。此外，DCT‑ViT模型包含的可训练参数量也远少于现有CNN模型的可训练参数量，可进一步减少存储模型所占用的资源。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于，尤其是一种基于双分类标记视觉transformer的doa估计方法。

技术介绍

1、doa(direction of arrival，波达方向)估计是一种确定信号来波方向的技术，通常应用于无线通信、雷达、声纳等领域；它通过分析阵列天线上接收的信号来确定信号源的到达角度，有助于定位目标或优化信号处理。

2、现有的基于深度学习低信噪比(signal-to-noise ratio，snr)的doa估计方法(papageorgiou g k,sellathurai m,eldar y c.deep networks for direction-of-arrival estimation in low snr[j].ieee transactions on signal processing,2021,69:3714-3729)通过构建深度网络模型，从接收信号的采样协方差矩阵中估计doa；在使用低snr场景下的信号协方差数据训练深度网络后，该网络能够实现比传统基于模型的doa估计方法更高的估计性能。

3、然而，上述方法存在一定的不足，具体表现为以下两点：

4、1、该方法采用的是卷积神经网络(cnn)这种较为传统的深度网络模型，与视觉transformer(vision transformer，vit)相比，cnn需要大量的参数和计算资源来构建深层的网络结构，而vit可以通过transformer的多头自注意力机制来实现更高效的特征提取和融合。

5、2、cnn难以捕捉网络输入(

6、3、在该方法所提出的深度网络模型中，只使用了4个卷积层和4个全连接层，网络结构较为简单；因此该方法的性能虽然优于传统的方法，但其doa估计的精度提升有限。

7、综上所述，设计新型神经网络模型以进一步提高低snr场景下的doa估计精度，提高不同场景下的doa估计鲁棒性成为一种前沿的发展趋势。

技术实现思路

1、为了解决上述技术问题，本专利技术提供了一种基于双分类标记视觉transformer的doa估计方法，通过基于双分类标记视觉transformer(dual class token visiontransformer，dct-vit)的低snr场景doa估计来实现；dct-vit模型包含了二维卷积层、transformer编码模块和全连接层，可以通过对不同snr条件下入射信号的采样协方差矩阵(sample covariance matrix，scm)数据进行充分学习，从而在相较于cnn有着更少可训练参数的前提下，进一步提高了低snr场景下的doa估计精度，并且在训练集未包含的snr和快拍数等条件下具有更好的doa估计鲁棒性。

2、一种基于双分类标记视觉transformer的doa估计方法，将doa估计问题建模成非线性多分类问题，并通过dct-vit模型来拟合这一非线性多分类问题，包括如下具体步骤：

3、步骤一、建立信号模型；

4、假设k个不相关的窄带远场信号sk(t)(k＝1,2,…,k)以相同的波长λ由不同方向θ＝[θ1,θ2,…,θk]入射至一个均匀线性阵列(ula)，其中第k个入射信号的方向为θk；

5、作为一种举例说明，所述ula包括：n个全向的天线阵元，所述天线阵元间的间距为d，d＝λ/2。

6、其中：λ表示信号波长；

7、在不失一般性的情况下，所述均匀线性阵列(ula)的第一个阵元被定义为参考，并设置在原点；因此，所述ula在时间t的接收信号可以被表述为：

8、x(t)＝as(t)+n(t) ⑴

9、其中：s(t)＝[s1(t),s2(t),…,sk(t)]t是信号源向量，[·]t代表向量或矩阵的转置；n(t)是均值为0、方差为的加性高斯白噪声向量；

10、定义所述ula的方向矩阵为：其中a(θk)对应着入射角度方向为θk导向矢量，并且可以被表示为：

11、

12、所述ula接收到的信号协方差矩阵的理论表达式为：

13、

14、作为一种举例说明，在实际应用中，所述协方差矩阵采用s个快拍数的采样协方差矩阵来近似，表示为：

15、

16、作为一种举例说明，所述均匀线性阵列(ula)是天线阵列中的一种。

17、步骤二、数据预处理和打标签；

18、①根据公式(1)-(4)可知，天线阵列可被视为一个非线性系统，所述天线阵列将空间域转换为接收信号的协方差矩阵，采用：g:θ→r表示；因此，需要神经网络通过学习未知的映射关系，进行从协方差矩阵到空间域的反映射，采用：ig:r→θ表示；即，网络输入y是与r相对应的矩阵或张量；

19、为了避免处理复值变量并充分利用接收到的信号的协方差信息，网络输入y被构造成一个维数为n×n×3的张量；

20、作为一种举例说明，所述输入y类似于图像，包含三个通道，分别为协方差矩阵r的：实部、虚部和相位项。

21、②将doa估计问题建模为一个多标签分类任务；

22、通过等角间隔△θ将空间域[θmin,θmax]划分为均匀网格

23、在训练阶段，输出向量zout中与输入张量中包含的角度相对应的元素被设为1，其余元素被设为0；

24、基于上述策略，训练数据集所述训练数据集包含有q个样本；

25、步骤三、dct-vit的架构设计；

26、dct-vit的架构包含：二维卷积层、多个transformer编码模块和多个全连接层；

27、transformer编码模块包括：多头自注意力层和多层感知机模块以及层归一化和随机路径丢弃；在每个随机路径丢弃操作之后都有一个残差连接；

28、输入y首先被传输进二维卷积层，然后进入批归一化层；二维卷积层包括维度为hc×hc的c个卷积核；这组图层的输出可以表示为：

29、

30、其中：p为横向或者纵向维度上的卷积核数量；

31、将yc的每个通道扁平化为维度为c的一维潜向量，得到一个由p2个向量组成的向量序列

32、在上述序列前后分别添加可学习的嵌入作为分类标记；

33、再将可学习的位置编码添加进补丁中，以保留位置信息，表示为：

34、

35、其中，是可训练的位置编码矩阵；由此生成的序列z0为transformer编码模块的输入；

36、transformer编码模块包括：le个串联的编码模块，每个编码模块包括：多头自注意力层、多层感知机模块、层归一化和随机路径丢弃；

37、作为一种举例说明，每个所述本文档来自技高网...

【技术保护点】

1.一种基于双分类标记视觉Transformer的DOA估计方法，将DOA估计问题建模成非线性多分类问题，并通过DCT-ViT模型来拟合这一非线性多分类问题，其特征在于，包括如下具体步骤：

2.根据权利要求1所述的一种基于双分类标记视觉Transformer的DOA估计方法，其特征在于，所述步骤一中建立信号模型的具体设置包括：

3.根据权利要求1所述的一种基于双分类标记视觉Transformer的DOA估计方法，其特征在于，所述Transformer编码模块包括：LE个串联的编码模块；每个编码模块包括：多头自注意力层、多层感知机模块、层归一化和随机路径丢弃；在每个随机路径丢弃操作之后都有一个残差连接；

4.根据权利要求1所述的一种基于双分类标记视觉Transformer的DOA估计方法，其特征在于，所述ULA包括：N个全向的天线阵元，所述天线阵元间的间距为d，d＝λ/2，λ为信号波长。

5.根据权利要求1所述的一种基于双分类标记视觉Transformer的DOA估计方法，其特征在于，在实际应用中，所述协方差矩阵采用S个快拍数的采样协方差矩阵来近似，表示为：

6.根据权利要求1所述的一种基于双分类标记视觉Transformer的DOA估计方法，其特征在于，所述输入Y类似于图像，包含三个通道，分别为协方差矩阵R的：实部、虚部和相位项。

7.根据权利要求3所述的一种基于双分类标记视觉Transformer的DOA估计方法，其特征在于，

8.根据权利要求3所述的一种基于双分类标记视觉Transformer的DOA估计方法，其特征在于，每个所述多层感知机模块包括：若干的全连接层与随机失活层的组合，其中：每个全连接层的激活函数不完全一致，根据具体任务，其激活函数可以为高斯误差线性单元(Gaussian Error Linear Unit，GELU)、线性(Linear)函数、线性整流函数(RectifiedLinear Unit，ReLU)和指数线性单元(Exponential Linear Unit，ELU)具有相同作用的函数。

9.根据权利要求3所述的一种基于双分类标记视觉Transformer的DOA估计方法，其特征在于，所述二元交叉熵损失的定义为：

10.根据权利要求2所述的一种基于双分类标记视觉Transformer的DOA估计方法，其特征在于，所述均匀线性阵列是天线阵列中的一种。

...

【技术特征摘要】

1.一种基于双分类标记视觉transformer的doa估计方法，将doa估计问题建模成非线性多分类问题，并通过dct-vit模型来拟合这一非线性多分类问题，其特征在于，包括如下具体步骤：

2.根据权利要求1所述的一种基于双分类标记视觉transformer的doa估计方法，其特征在于，所述步骤一中建立信号模型的具体设置包括：

3.根据权利要求1所述的一种基于双分类标记视觉transformer的doa估计方法，其特征在于，所述transformer编码模块包括：le个串联的编码模块；每个编码模块包括：多头自注意力层、多层感知机模块、层归一化和随机路径丢弃；在每个随机路径丢弃操作之后都有一个残差连接；

4.根据权利要求1所述的一种基于双分类标记视觉transformer的doa估计方法，其特征在于，所述ula包括：n个全向的天线阵元，所述天线阵元间的间距为d，d＝λ/2，λ为信号波长。

5.根据权利要求1所述的一种基于双分类标记视觉transformer的doa估计方法，其特征在于，在实际应用中，所述协方差矩阵采用s个快拍数的采样协方差矩阵来近似，表示为：

6.根据权利要求1所述的一种基...

【专利技术属性】
技术研发人员：张治，郭宇，黄育侦，马楠，张平，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人