一种音频信号的解混响方法和装置制造方法及图纸

技术编号:21895723 阅读:108 留言:0更新日期:2019-08-17 16:01
本发明专利技术实施例公开一种音频信号的解混响方法和装置。其中,获取从音频通道采集到的第一音频混响信号和第二音频混响信号,第一音频混响信号是在当前帧对M个频点采集得到,第二音频混响信号是在历史帧对M个频点采集得到,根据第一音频混响信号和第二音频混响信号对M个频点中的N个频点,在历史帧对应的房间回归系数的基础上进行更新,得到N个频点在当前帧对应的房间回归系数,将已知的数值配置为M个频点中除N个频点以外的(M‑N)个频点在当前帧对应的房间回归系数。按照M个频点在当前帧对应的房间回归系数,获取当前帧对应的纯净语音信号。

A Dereverberation Method and Device for Audio Signal

【技术实现步骤摘要】
一种音频信号的解混响方法和装置
本专利技术涉及计算机
,尤其涉及一种音频信号的解混响方法和装置。
技术介绍
在远场语音交互中,麦克风通常距离声源的位置较远,此时接收到的音频信号会受到混响的影响。混响极大的降低了音频信号的识别准确率,导致现有的语音识别的精度急剧下降。为了降低混响对音频信号的影响,通常会对接收到的音频信号进行解混响。解混响能在一定程度上进行改善,提升语音交互的体验。在现有技术中,存在一些用于滤除音频信号中的混响的解混响算法。然而,这些解混响算法通常都存在如下的问题:在求解用于滤除混响的滤波器系数时,常会涉及大量的矩阵求逆、矩阵相乘的计算。矩阵间的运算量较大、算法复杂度较高,因此会造成解混响算法的实时性较差,影响了解混响的性能。
技术实现思路
本专利技术实施例提供了一种音频信号的解混响方法和装置。用于降低解混响算法的复杂度,提高解混响性能。为解决上述技术问题,本专利技术实施例提供以下技术方案:第一方面,本专利技术实施例提供一种音频信号的解混响方法,包括:获取从音频通道采集到的第一音频混响信号和第二音频混响信号,所述第一音频混响信号是在当前帧对M个频点采集得到,所述第二音频混响信号是在所述当前帧之前的历史帧对所述M个频点采集得到,所述M为正整数;根据所述第一音频混响信号和所述第二音频混响信号对所述M个频点中的N个频点,在所述历史帧对应的房间回归系数的基础上进行更新,得到所述N个频点在所述当前帧对应的房间回归系数,所述N为小于所述M的正整数;将已知的数值配置为所述M个频点中除所述N个频点以外的(M-N)个频点在所述当前帧对应的房间回归系数,所述已知的数值通过所述M个频点对应的已得到的房间回归系数确定;按照所述M个频点在所述当前帧对应的房间回归系数,获取所述当前帧对应的纯净语音信号。第二方面,本专利技术实施例还提供一种音频信号的解混响装置,包括:混响信号获取模块,用于获取从音频通道采集到的第一音频混响信号和第二音频混响信号,所述第一音频混响信号是在当前帧对M个频点采集得到,所述第二音频混响信号是在所述当前帧之前的历史帧对所述M个频点采集得到,所述M为正整数;系数更新模块,用于根据所述第一音频混响信号和所述第二音频混响信号对所述M个频点中的N个频点在所述历史帧对应的房间回归系数的基础上进行更新,得到所述N个频点在所述当前帧对应的房间回归系数,所述N为小于所述M的正整数;系数配置模块,用于将已知的数值配置为所述M个频点中除所述N个频点以外的(M-N)个频点在所述当前帧对应的房间回归系数,所述已知的数值通过所述M个频点对应的已得到的房间回归系数确定;语音信号获取模块,用于按照所述M个频点在所述当前帧对应的房间回归系数,获取所述当前帧对应的纯净语音信号。在第二方面中,音频信号的解混响装置的组成模块还可以执行前述第一方面以及各种可能的实现方式中所描述的步骤,详见前述对第一方面以及各种可能的实现方式中的说明。第三方面,本专利技术实施例提供一种音频信号的解混响装置,该音频信号的解混响装置包括:处理器、存储器;存储器用于存储指令;处理器用于执行存储器中的指令,使得音频信号的解混响装置执行如前述第一方面中任一项的方法。第四方面,本专利技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。从以上技术方案可以看出,本专利技术实施例具有以下优点:在本专利技术实施例中,首先获取从音频通道采集到的第一音频混响信号和第二音频混响信号,第一音频混响信号是在当前帧对M个频点采集得到,第二音频混响信号是在当前帧之前的历史帧对M个频点采集得到,然后根据第一音频混响信号和第二音频混响信号对M个频点中的N个频点,在历史帧对应的房间回归系数的基础上进行更新,得到N个频点在当前帧对应的房间回归系数,将已知的数值配置为M个频点中除N个频点以外的(M-N)个频点在当前帧对应的房间回归系数,得到(M-N)个频点在当前帧对应的房间回归系数。最后按照M个频点在当前帧对应的房间回归系数,获取当前帧对应的纯净语音信号。本专利技术实施例中对M个频点中只有N个频点在历史帧对应的房间回归系数的基础上进行更新,而其余的(M-N)个频点可通过已知的数值来配置(M-N)个频点在当前帧对应的房间回归系数,这(M-N)个频点不需要通过历史帧对应的房间回归系数更新,因此这(M-N)个频点不需要参与矩阵间的运算,在一定程度上缓解了解混响算法的工作量,降低解混响算法的复杂度,提高解混响性能。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域的技术人员来讲,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种音频信号的解混响方法所应用的场景示意图;图2为本专利技术实施例提供的音频信号的解混响方法所应用的系统架构示意图;图3为本专利技术实施例提供的一种音频信号的解混响方法的流程方框示意图;图4为本专利技术实施例提供的音频信号的处理算法的流程方框示意图;图5-a为本专利技术实施例提供的原始语音信号的语音频谱图;图5-b为本专利技术实施例提供的使用每帧更新房间回归系数的解混响算法处理后的纯净语音信号的语音频谱图;图5-c为本专利技术实施例提供的使用跳帧更新房间回归系数的解混响算法处理后的纯净语音信号的语音频谱图;图6-a为本专利技术实施例提供的一种音频信号的解混响装置的组成结构示意图;图6-b为本专利技术实施例提供的一种系数更新模块的组成结构示意图;图7为本专利技术实施例提供的一种音频信号的解混响方法应用于终端的组成结构示意图。具体实施方式本专利技术实施例提供了一种音频信号的解混响方法和装置。用于降低解混响算法的复杂度,提高解混响性能。为使得本专利技术的专利技术目的、特征、优点能够更加的明显和易懂,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本专利技术一部分实施例,而非全部实施例。基于本专利技术中的实施例,本领域的技术人员所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它单元。以下分别进行详细说明。本专利技术音频信号的解混响方法的一个实施例,具体可以应用于对音频混响信号的解混响算法中。请参阅图1所示,为本专利技术实施例提供的一种音频信号的解混响方法所应用的场景示意图。终端可以执行本专利技术实施例提供的音频信号的解混响方法,该终端内可以集成有麦克风,用户发出原始语音信号之后,该原始语音信号可以作为直达声被终端通过音频通道采集到,该原始语音信号也可以在房间内经过障碍物反射之后作为音频混响信号被终端通过音频通道采集到。当采集声音的终端和声源之间存在一定的距离时,采集声音的终端采集到的音频信号将受到混响的影响,混响会影响语音的清晰度,导致语音识别困难。本专利技术实施例采用解混响算法可以过滤掉混响,提高语音识别的准确率,同时本专利技术实施例提供的解混响算法的计算复杂度不高,对于终端的中央处理本文档来自技高网...

【技术保护点】
1.一种音频信号的解混响方法,其特征在于,包括:获取从音频通道采集到的第一音频混响信号和第二音频混响信号,所述第一音频混响信号是在当前帧对M个频点采集得到,所述第二音频混响信号是在所述当前帧之前的历史帧对所述M个频点采集得到,所述M为正整数;根据所述第一音频混响信号和所述第二音频混响信号对所述M个频点中的N个频点,在所述历史帧对应的房间回归系数的基础上进行更新,得到所述N个频点在所述当前帧对应的房间回归系数,所述N为小于所述M的正整数;将已知的数值配置为所述M个频点中除所述N个频点以外的(M‑N)个频点在所述当前帧对应的房间回归系数,所述已知的数值通过所述M个频点对应的已得到的房间回归系数确定;按照所述M个频点在所述当前帧对应的房间回归系数,获取所述当前帧对应的纯净语音信号。

【技术特征摘要】
1.一种音频信号的解混响方法,其特征在于,包括:获取从音频通道采集到的第一音频混响信号和第二音频混响信号,所述第一音频混响信号是在当前帧对M个频点采集得到,所述第二音频混响信号是在所述当前帧之前的历史帧对所述M个频点采集得到,所述M为正整数;根据所述第一音频混响信号和所述第二音频混响信号对所述M个频点中的N个频点,在所述历史帧对应的房间回归系数的基础上进行更新,得到所述N个频点在所述当前帧对应的房间回归系数,所述N为小于所述M的正整数;将已知的数值配置为所述M个频点中除所述N个频点以外的(M-N)个频点在所述当前帧对应的房间回归系数,所述已知的数值通过所述M个频点对应的已得到的房间回归系数确定;按照所述M个频点在所述当前帧对应的房间回归系数,获取所述当前帧对应的纯净语音信号。2.根据权利要求1所述的方法,其特征在于,所述将已知的数值配置为所述M个频点中除所述N个频点以外的(M-N)个频点在所述当前帧对应的房间回归系数,包括:将所述(M-N)个频点在所述历史帧对应的房间回归系数配置为所述(M-N)个频点在所述当前帧对应的房间回归系数;或,将所述N个频点在所述历史帧对应的房间回归系数配置为所述(M-N)个频点在所述当前帧对应的房间回归系数;或,将所述N个频点在所述当前帧对应的房间回归系数配置为所述(M-N)个频点在所述当前帧对应的房间回归系数。3.根据权利要求1所述的方法,其特征在于,所述N个频点为所述M个频点中满足频点分类条件的频点,所述(M-N)个频点为所述M个频点中不满足所述频点分类条件的频点。4.根据权利要求3所述的方法,其特征在于,所述频点分类条件包括:从所述M个频点中按照每间隔S个频点选择出一个频点,选择出的所有频点构成所述N个频点,所述S为大于0的正整数;或,从所述M个频点中按照每间隔T个频点选择出连续的P个频点,选择出的所有频点构成所述N个频点,所述T和所述P为正整数。5.根据权利要求4所述的方法,其特征在于,当所述S的取值为1时,所述M个频点中的奇数频点属于所述N个频点,或者所述M个频点中的偶数频点属于所述N个频点;或者,当所述T的取值为0、且所述P的取值等于所述M的二分之一时,所述M个频点中的低频段频点属于所述N个频点。6.根据权利要求5所述的方法,其特征在于,当所述N个频点为所述奇数频点时,所述(M-N)个频点为所述M个频点中的偶数频点;或,当所述N个频点为所述偶数频点时,所述(M-N)频点为所述M个频点中的奇数频点;或,当所述N个频点为所述低频段频点时,所述(M-N)个频点为所述M个频点中的高频段频点。7.根据权利要求1至6中任一项所述的方法,其特征在于,所述方法还包括:获取所述当前帧之后的下一帧音频混响信号;将所述当前帧更新后的房间回归系数配置为所述下一帧音频混响信号的(M-N)个频点的房间回归系数,以及将已知的数值配置为所述下一帧音频混响信号的N个频点的房间回归系数;以及对于所述下一帧音频混响信号之后的每两个音频混响信号,根据所述更新后的房间回归系数和已知的数值,交替配置其中N个频点和(M-N)个频点的房间回归系数。8.一种音频信号的解混响装置,其特征在于,包括:混响信号获取模块,用于获取从音频通道采集到的第一...

【专利技术属性】
技术研发人员:纪璇于蒙陈联武
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1