System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 音频信号的融合方法及装置、计算机存储介质及终端制造方法及图纸_技高网

音频信号的融合方法及装置、计算机存储介质及终端制造方法及图纸

技术编号:40064603 阅读:8 留言:0更新日期:2024-01-16 23:13
本申请提供了一种音频信号的融合方法及装置、存储介质及终端,涉及音频处理技术领域。该方法包括:确定多个设备的音频信号的短时频域表示;根据音频信号的短时频域表示确定时变线性预测误差滤波器的频率响应,并计算线性预测误差的短时频谱;从短时频谱中抽取低频系数并确定线性预测误差包络;对线性预测误差包络进行幅度补偿和非线性压缩,并提取特征;根据非线性压缩信号的方差确定各路音频信号对应的权重,并根据权重对各路音频信号进行融合。本方案能够在混响较强的环境中通过确定多通道音频的权重改善融合音频信号的质量,提高语音的清晰度和可懂度。

【技术实现步骤摘要】

本申请涉及音频处理,尤其涉及一种音频信号的融合方法及装置、计算机可读存储介质及终端。


技术介绍

1、在多人会议场景中,通过会议终端一体机(一般安装在靠墙的位置)上的阵列麦克风进行远距离拾音所得到的拾音信号的质量通常不佳。为了提高麦克风拾音效果,一种可行的方案是在更靠近说话人的位置布置一个或多个无线麦克风,并将无线麦克风的拾音信号和会议终端一体机的拾音信号进行联合处理。通常情况下,距离说话人更近的麦克风拾音信号的质量更好,而距离说话人较远的麦克风拾音信号的信噪比和信混比都比较低,质量较差。因此,为了发挥多个无线麦克风的作用,需要将多路拾音信号进行融合。

2、需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。


技术实现思路

1、本申请的目的在于提供一种音频信号的融合方法及装置、计算机可读存储介质及设备,至少能够在一定程度上提高融合音频信号的质量。

2、本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。

3、根据本申请的第一个方面,提供一种音频信号的融合方法,该方法包括:确定多个设备对应的各路音频信号的短时频域表示;根据上述各路音频信号的短时频域表示,确定上述各路音频信号的时变线性预测误差滤波器的频率响应,并根据上述短时频域表示和上述时变线性预测误差滤波器的频率响应计算上述各路音频信号的线性预测误差的短时频谱;从上述线性预测误差的短时频谱中抽取低频系数并重新组合,以确定上述各路音频信号对应的线性预测误差包络的短时频谱,并根据上述线性预测误差包络的短时频谱确定上述各路音频信号的线性预测误差包络;对上述线性预测误差包络进行非线性压缩处理,得到上述各路音频信号的非线性压缩信号;根据上述非线性压缩信号的方差确定上述各路音频信号对应的权重,并根据上述权重对上述各路音频信号进行融合。

4、在本申请一个实施例中,上述确定多个设备对应的各路音频信号的短时频域表示,包括:对上述各路音频信号进行分帧,得到上述各路音频信号对应的时域分帧信号;对上述时域分帧信号进行加窗和快速傅里叶变换,得到上述各路音频信号的短时频域表示。

5、在本申请一个实施例中,上述根据上述各路音频信号的短时频域表示,确定上述各路音频信号的时变线性预测误差滤波器的频率响应,包括:在上述短时频域表示的目标帧中确定各频点的实部和虚部的平方和,得到上述各路音频信号在上述目标帧的功率谱;对上述功率谱进行逆向快速傅里叶变换,得到上述各路音频信号在上述目标帧的自相关函数;根据上述自相关函数确定上述各路音频信号的时变线性预测误差滤波器系数;对上述时变线性预测误差滤波器系数进行快速傅里叶变换,得到上述各路音频信号的时变线性预测误差滤波器的频率响应。

6、在本申请一个实施例中,上述根据上述自相关函数确定上述各路音频信号的时变线性预测误差滤波器系数,包括:选取上述各路音频信号在上述目标帧的自相关函数的前p+1个值,并根据上述自相关函数的前p+1个值确定上述各路音频信号的p阶线性预测系数,其中,p为正整数;取上述p阶线性预测系数的相反数并增加首项1,得到上述各路音频信号的长度为p+1的时变线性预测误差滤波器系数。

7、在本申请一个实施例中,上述根据上述短时频域表示和上述时变线性预测误差滤波器的频率响应计算上述各路音频信号的线性预测误差的短时频谱,包括:将上述频域表示中各频点的复数系数与上述时变线性预测误差滤波器的频率响应中各频点的复数系数对应相乘,得到上述各路音频信号的线性预测误差的短时频谱。

8、在本申请一个实施例中,上述从上述线性预测误差的短时频谱中抽取低频系数并重新组合,以确定上述各路音频信号对应的线性预测误差包络的短时频谱,包括:确定近似包络所需的下采样率,并根据上述线性预测误差的短时频谱的频点数和上述下采样率,确定上述线性预测误差的短时频谱中待抽取频点的下标;根据上述待抽取频点的下标,从上述线性预测误差的短时频谱中抽取对应频点的系数,并重新组合出上述线性预测误差包络的短时频谱。

9、在本申请一个实施例中,上述根据上述线性预测误差包络的短时频谱确定上述各路音频信号的线性预测误差包络,包括:对上述线性预测误差包络的短时频谱进行逆向快速傅里叶变换,得到上述线性预测误差包络。

10、在本申请一个实施例中,上述对上述线性预测误差包络进行非线性压缩处理,得到上述各路音频信号的非线性压缩信号,包括:逐帧计算上述线性预测误差包络的平均能量,并对上述线性预测误差包络的平均能量进行指数平滑,得到更新后的当前帧平均能量;从上述线性预测误差包络信号当前帧的对数变换中减去上述更新后的当前帧平均能量,得到相减结果,并计算上述相减结果的指数函数,得到幅度补偿的线性预测误差包络;计算上述幅度补偿的线性预测误差包络的三次方根,得到上述非线性压缩信号。

11、在本申请一个实施例中,上述根据上述非线性压缩信号的方差确定上述各路音频信号对应的权重,并根据上述权重对上述各路音频信号进行融合,包括:计算上述非线性压缩信号的方差,得到上述各路音频信号的方差;将上述各路音频信号的方差输入权重调整器中,并根据上述权重调整器所输出的权重对上述各路音频信号进行融合。

12、在本申请一个实施例中,上述方法还包括:将上述非线性压缩信号的方差作为上述各路音频信号的特征;上述权重调整器用于:根据上述各路音频信号的特征在上述各路音频信号中的分布情况,对上述各路音频信号赋予相应的权重;限制上述各路音频信号的权重的变化速率。

13、根据本申请的第二个方面,提供一种音频信号的融合装置,上述装置包括:第一确定模块,用于:确定多个设备对应的各路音频信号的短时频域表示;第二确定模块,用于:根据上述各路音频信号的短时频域表示,确定上述各路音频信号的时变线性预测误差滤波器的频率响应,并根据上述短时频域表示和上述时变线性预测误差滤波器的频率响应计算上述各路音频信号的线性预测误差的短时频谱;第三确定模块,用于:从上述线性预测误差的短时频谱中抽取低频系数并重新组合,以确定上述各路音频信号对应的线性预测误差包络的短时频谱,并根据上述线性预测误差包络的短时频谱确定上述各路音频信号的线性预测误差包络;非线性压缩模块,用于:对上述线性预测误差包络进行非线性压缩处理,得到上述各路音频信号的非线性压缩信号;融合模块,用于:根据上述非线性压缩信号的方差确定上述各路音频信号对应的权重,并根据上述权重对上述各路音频信号进行融合。

14、根据本申请的第三个方面,提供一种终端,包括:存储器、处理器以及存储在上述存储器中并可在上述处理器上运行的计算机程序,上述处理器执行上述计算机程序时实现上述第一个方面所述的音频信号的融合方法。

15、根据本申请的第四个方面,提供一种计算机可读存储介质,其上存储有计算机程序,上述计算机程序被处理器执行时实现上述第一个方面所述的音频信号的融合方法。

1本文档来自技高网...

【技术保护点】

1.一种音频信号的融合方法,其特征在于,包括:

2.根据权利要求1所述的音频信号的融合方法,其特征在于,所述确定多个设备对应的各路音频信号的短时频域表示,包括:

3.根据权利要求1所述的音频信号的融合方法,其特征在于,所述根据所述各路音频信号的短时频域表示,确定所述各路音频信号的时变线性预测误差滤波器的频率响应,包括:

4.根据权利要求3所述的音频信号的融合方法,其特征在于,所述根据所述自相关函数确定所述各路音频信号的时变线性预测误差滤波器系数,包括:

5.根据权利要求1至4中任意一项所述的音频信号的融合方法,其特征在于,所述根据所述短时频域表示和所述时变线性预测误差滤波器的频率响应计算所述各路音频信号的线性预测误差的短时频谱,包括:

6.根据权利要求1至4中任意一项所述的音频信号的融合方法,其特征在于,所述从所述线性预测误差的短时频谱中抽取低频系数并重新组合,以确定所述各路音频信号对应的线性预测误差包络的短时频谱,包括:

7.根据权利要求1至4中任意一项所述的音频信号的融合方法,其特征在于,所述根据所述线性预测误差包络的短时频谱确定所述各路音频信号的线性预测误差包络,包括:

8.根据权利要求1至4中任意一项所述的音频信号的融合方法,其特征在于,所述对所述线性预测误差包络进行非线性压缩处理,得到所述各路音频信号的非线性压缩信号,包括:

9.根据权利要求1所述的音频信号的融合方法,其特征在于,所述根据所述非线性压缩信号的方差确定所述各路音频信号对应的权重,并根据所述权重对所述各路音频信号进行融合,包括:

10.根据权利要求9所述的音频信号的融合方法,其特征在于,所述方法还包括:将所述非线性压缩信号的方差作为所述各路音频信号的特征;

11.一种音频信号的融合装置,其特征在于,包括:

12.一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至10中任一项所述的音频信号的融合方法。

13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至10中任一项所述的音频信号的融合方法。

...

【技术特征摘要】

1.一种音频信号的融合方法,其特征在于,包括:

2.根据权利要求1所述的音频信号的融合方法,其特征在于,所述确定多个设备对应的各路音频信号的短时频域表示,包括:

3.根据权利要求1所述的音频信号的融合方法,其特征在于,所述根据所述各路音频信号的短时频域表示,确定所述各路音频信号的时变线性预测误差滤波器的频率响应,包括:

4.根据权利要求3所述的音频信号的融合方法,其特征在于,所述根据所述自相关函数确定所述各路音频信号的时变线性预测误差滤波器系数,包括:

5.根据权利要求1至4中任意一项所述的音频信号的融合方法,其特征在于,所述根据所述短时频域表示和所述时变线性预测误差滤波器的频率响应计算所述各路音频信号的线性预测误差的短时频谱,包括:

6.根据权利要求1至4中任意一项所述的音频信号的融合方法,其特征在于,所述从所述线性预测误差的短时频谱中抽取低频系数并重新组合,以确定所述各路音频信号对应的线性预测误差包络的短时频谱,包括:

7.根据权利要求1至4中任意一项所述的音频信号的融合方法,其特征在于,所述根据所述线性...

【专利技术属性】
技术研发人员:李天宇郭玉峰
申请(专利权)人:广州视源电子科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1