【技术实现步骤摘要】
本专利技术涉及语音处理技术,特别涉及一种基于麦克风阵列的低时延语音增强方法。
技术介绍
1、语音增强是一种消除语音传播过程中受到的背景噪声或方向性干扰,以提高语音质量的技术。其中,多通道波束形成技术可以充分利用时间和空间信息,有效降低语音失真。基于深度学习(deep learning,dl)的语音增强方法利用深度神经网络(deep neuralnetwork,dnn)的复杂结构和较强的表达能力,学习麦克风接收信号与期望信号及其特征之间的关系,在各种背景噪声下均适用,是一种高效的技术手段。
2、现有的基于dl的频域波束形成方法主要是对信号的协方差矩阵进行估计,然后用于最小方差无失真响应(minimum variance distortionless response,mvdr)的波束形成中,该类方法对语音质量有一定提升,但是残留噪声大,同时为了保证频域分辨率帧长较长,在训练过程中还需提取信号的上下文信息丰富特征,所以系统时延也较大。
3、现有的时域滤波求和网络(filter-and-sum network,fasn
...【技术保护点】
1.一种基于麦克风阵列的低时延语音增强方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于麦克风阵列的低时延语音增强方法,其特征在于,步骤1包括:
3.根据权利要求1所述的一种基于麦克风阵列的低时延语音增强方法,其特征在于,步骤2包括:
4.根据权利要求3所述的一种基于麦克风阵列的低时延语音增强方法,其特征在于,步骤3包括:
5.根据权利要求4所述的一种基于麦克风阵列的低时延语音增强方法,其特征在于,改进的时序网络SeqNet(·)开始位置包括一个输出通道数为B的线性瓶颈层,则状态空间方程对应的帧级各通道自
...【技术特征摘要】
1.一种基于麦克风阵列的低时延语音增强方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于麦克风阵列的低时延语音增强方法,其特征在于,步骤1包括:
3.根据权利要求1所述的一种基于麦克风阵列的低时延语音增强方法,其特征在于,步骤2包括:
4.根据权利要求3所述的一种基于麦克风阵列的低时延语音增强方法,其特征在于,步骤...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。