一种基于麦克风阵列的低时延语音增强方法技术

技术编号:43897907 阅读:15 留言:0更新日期:2025-01-03 13:10
本发明专利技术公开了一种基于麦克风阵列的低时延语音增强方法,该方法包括:设置一组初始极点参数,利用人工神经网络优化初始极点参数,得到实数极点;利用实数极点构建麦克风阵列各通道的正交基函数模型,并计算各阶滤波器响应;对麦克风阵列接收信号进行分帧和时域特征提取,并利用改进的时序网络估计正交基函数模型构成的自适应波束形成器权值;根据滤波器响应和波束形成器权值计算波束形成网络各通道系统响应,获得增强后的完整语音信号。本发明专利技术通过使用正交基结构波束形成网络,可以灵活调节极点,提升网络自由度,缩短滤波器长度,降低网络时延;在滤波器长度更短的情况下,达到更好的语音增强效果。

【技术实现步骤摘要】

本专利技术涉及语音处理技术,特别涉及一种基于麦克风阵列的低时延语音增强方法


技术介绍

1、语音增强是一种消除语音传播过程中受到的背景噪声或方向性干扰,以提高语音质量的技术。其中,多通道波束形成技术可以充分利用时间和空间信息,有效降低语音失真。基于深度学习(deep learning,dl)的语音增强方法利用深度神经网络(deep neuralnetwork,dnn)的复杂结构和较强的表达能力,学习麦克风接收信号与期望信号及其特征之间的关系,在各种背景噪声下均适用,是一种高效的技术手段。

2、现有的基于dl的频域波束形成方法主要是对信号的协方差矩阵进行估计,然后用于最小方差无失真响应(minimum variance distortionless response,mvdr)的波束形成中,该类方法对语音质量有一定提升,但是残留噪声大,同时为了保证频域分辨率帧长较长,在训练过程中还需提取信号的上下文信息丰富特征,所以系统时延也较大。

3、现有的时域滤波求和网络(filter-and-sum network,fasnet)在时域对波束形本文档来自技高网...

【技术保护点】

1.一种基于麦克风阵列的低时延语音增强方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于麦克风阵列的低时延语音增强方法,其特征在于,步骤1包括:

3.根据权利要求1所述的一种基于麦克风阵列的低时延语音增强方法,其特征在于,步骤2包括:

4.根据权利要求3所述的一种基于麦克风阵列的低时延语音增强方法,其特征在于,步骤3包括:

5.根据权利要求4所述的一种基于麦克风阵列的低时延语音增强方法,其特征在于,改进的时序网络SeqNet(·)开始位置包括一个输出通道数为B的线性瓶颈层,则状态空间方程对应的帧级各通道自适应波速形成器的权值...

【技术特征摘要】

1.一种基于麦克风阵列的低时延语音增强方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于麦克风阵列的低时延语音增强方法,其特征在于,步骤1包括:

3.根据权利要求1所述的一种基于麦克风阵列的低时延语音增强方法,其特征在于,步骤2包括:

4.根据权利要求3所述的一种基于麦克风阵列的低时延语音增强方法,其特征在于,步骤...

【专利技术属性】
技术研发人员:陈华伟李妍文
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1