当前位置: 首页 > 专利查询>东南大学专利>正文

基于多任务深度学习网络的螺旋麦克风阵列的声成像方法技术

技术编号:43766032 阅读:59 留言:0更新日期:2024-12-24 16:07
本发明专利技术公开了一种基于多任务深度学习网络的螺旋麦克风阵列的声成像方法。通过短时傅里叶变换STFT,将麦克风阵列捕获的音频信号转为频谱图,提取其实部和虚部作为特征输入。这些特征分别输入到双流结构的双注意力网络中,以自适应方式融合局部和全局特征。之后,两路输出融合并通过卷积层及双向门控循环单元Bi‑GRU层进一步处理。通过两个全连接层分别计算声源位置和声压分布。最后,成像模块将声压分布信息与摄像头图像结合,生成直观的声像图。本发明专利技术通过引入频谱图的实部和虚部分量作为特征输入的双流结构,并分别结合双注意力网络模块,实现了在较少阵元条件下进行实时声源定位与成像,并且具备较高的空间分辨率和较强的抗干扰能力。

【技术实现步骤摘要】

本专利技术属于声学成像,具体涉及一种基于多任务深度学习网络的螺旋麦克风阵列的声成像方法


技术介绍

1、传统的声源定位与成像技术主要依赖于波束形成算法,尽管此类方法能在一定程度上实现基本的声源定位功能,但它们普遍存在对阵元数量和阵列分布形状的高度依赖性,导致定位精度不高、处理速度慢等问题。尤其是在噪声较大的复杂声学环境中,这些技术的抗干扰能力相对较弱。近年来,随着深度学习技术的快速发展,利用神经网络模型进行声源定位与成像的研究逐渐增多,此类方法能够在一定程度上克服传统算法的局限性。然而,当前大多数基于深度学习的声源定位技术主要侧重于信号位置信息的提取,而在声压分布的可视化处理方面尚显不足,因此不能全面地呈现声场信息。


技术实现思路

1、为解决上述问题,本专利技术公开了一种基于多任务深度学习网络的螺旋麦克风阵列的声成像方法,实现在较少阵元条件下的实时声源定位与成像,并且具备高空间分辨率和强抗干扰能力。

2、为达到上述目的,本专利技术的技术方案如下:

3、基于多任务深度学习网络的螺旋麦克风本文档来自技高网...

【技术保护点】

1.基于多任务深度学习网络的螺旋麦克风阵列的声成像方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于多任务深度学习网络的螺旋麦克风阵列的声成像方法,其特征在于,步骤(1)中音频信号STFT处理方法如下:

3.根据权利要求1所述的基于多任务深度学习网络的螺旋麦克风阵列的声成像方法,其特征在于,步骤(2)中双注意力网络模块建模方法如下:

4.根据权利要求3所述的基于多任务深度学习网络的螺旋麦克风阵列的声成像方法,

5.根据权利要求3所述的基于多任务深度学习网络的螺旋麦克风阵列的声成像方法,

6.根据权利要求3所述的基于多...

【技术特征摘要】

1.基于多任务深度学习网络的螺旋麦克风阵列的声成像方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于多任务深度学习网络的螺旋麦克风阵列的声成像方法,其特征在于,步骤(1)中音频信号stft处理方法如下:

3.根据权利要求1所述的基于多任务深度学习网络的螺旋麦克风阵列的声成像方法,其特征在于,步骤(2)中双注意力网络模块建模方法如下:

4.根据权利要求3所述的基于多任务深度学习网络的螺旋麦克风阵列的声成像方法,

5.根据权利要求3所述的基于多任务深度学习网络的螺旋麦克风阵列的声成像方法,

6.根据权利要求3所述的基于多...

【专利技术属性】
技术研发人员:赵立业高昂杨睿刘星佑梁瑞宇王青云
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1