音频信号的处理方法及装置、存储介质制造方法及图纸

技术编号:24941987 阅读:50 留言:0更新日期:2020-07-17 21:50
本公开是关于一种音频信号处理方法及装置、存储介质。该方法包括:由至少两个麦克风获取至少两个声源各自发出的音频信号,以获得至少两个麦克风各自的原始带噪信号;对于时域上的每一帧,根据至少两个麦克风各自的原始带噪信号,获取至少两个声源各自的频域估计信号;将预定的频带范围划分为多个频率子带,其中,每个频率子带包含多个频点,且任意两个相邻的频率子带具有重叠频带;根据在各频率子带内各频点的频域估计信号,确定频率子带包含的各频点的加权系数;根据加权系数,确定各频点的分离矩阵;基于分离矩阵及原始带噪信号,获得至少两个声源各自发出的音频信号。通过本公开实施例的技术方案,能够减少语音的损伤,提升语音信号质量。

【技术实现步骤摘要】
音频信号的处理方法及装置、存储介质
本公开涉及信号处理领域,尤其涉及一种音频信号的处理方法及装置、存储介质。
技术介绍
相关技术中,智能产品设备拾音多采用麦克风阵列,应用麦克风波束形成技术提高语音信号处理质量,以提高真实环境下的语音识别率。但多个麦克风的波束形成技术对麦克风位置误差敏感,性能影响较大,另外麦克风个数增多了也会导致产品成本升高。因此,目前越来越多的智能产品设备只配置两个麦克风;两个麦克风常采用完全不同于多个麦克风波束形成技术的盲源分离技术对语音进行增强,而如何使得基于盲源分离技术分离后信号的语音质量更高是目前迫切需要解决的问题。
技术实现思路
本公开提供一种音频信号的处理方法及装置、存储介质。根据本公开实施例的第一方面,提供一种音频信号处理方法,包括:由至少两个麦克风获取至少两个声源各自发出的音频信号,以获得所述至少两个麦克风各自的原始带噪信号;对于时域上的每一帧,根据所述至少两个麦克风各自的所述原始带噪信号,获取所述至少两个声源各自的频域估计信号;将预定的频带范围划分为多个频率子带,其中,每个频率子带包含多个频点,且任意两个相邻的所述频率子带具有重叠频带;根据在各所述频率子带内各频点的所述频域估计信号,确定所述频率子带包含的各频点的加权系数;根据所述加权系数,确定各频点的分离矩阵;基于所述分离矩阵及所述原始带噪信号,获得至少两个声源各自发出的音频信号。在一些实施例中,所述根据各所述频率子带内各频点的所述频域估计信号,确定所述频率子带内包含的各频点的加权系数,包括:根据各所述频率子带内各频点的所述频域估计信号,确定所述频域估计信号的分布函数;根据所述分布函数,确定所述各频点的所述加权系数。在一些实施例中,所述根据各所述频率子带内各频点的所述频域估计信号,确定所述频域估计信号的分布函数,包括:确定各所述频率子带中各频点的所述频域估计信号与标准差比值的平方;对各所述频率子带中各频点的所述比值的平方求和,确定第一和;获取各所述频率子带对应的所述第一和的开方和,得到第二和;根据所述第二和为变量的指数函数,确定所述分布函数。在一些实施例中,所述根据各所述频率子带内各频点的所述频域估计信号,确定所述频域估计信号的分布函数,包括:确定各所述频率子带中各频点的所述频域估计信号与标准差之间比值的平方;对各所述频率子带中各频点的所述比值的平方求和,确定第三和;根据各所述频率子带对应的所述第三和的预定次方,确定第四和;根据所述第四和为变量的指数函数,确定所述分布函数。在一些实施例中,所述将预定的频带范围划分为多个频率子带,包括:将预定的频带范围划分为C个频率子带,其中,C为大于1的整数;所述任意两个相邻的所述频率子带具有重叠频带,包括:第c个所述频率子带的第一个频点小于第c-1个所述频率子带的最后一个频点;其中,c为大于或等于2且小于或等于C。根据本公开实施例的第二方面,提供一种音频信号处理装置,包括:第一获取模块,用于由至少两个麦克风获取至少两个声源各自发出的音频信号,以获得所述至少两个麦克风各自的原始带噪信号;第二获取模块,用于对于时域上的每一帧,根据所述至少两个麦克风各自的所述原始带噪信号,获取所述至少两个声源各自的频域估计信号;划分模块,用于将预定的频带范围划分为多个频率子带,其中,每个频率子带包含多个频点,且任意两个相邻的所述频率子带具有重叠频带;第一确定模块,用于根据在各所述频率子带内各频点的所述频域估计信号,确定所述频率子带包含的各频点的加权系数;第二确定模块,用于根据所述加权系数,确定各频点的分离矩阵;第三获取模块,用于基于所述分离矩阵及所述原始带噪信号,获得至少两个声源各自发出的音频信号。在一些实施例中,所述第一确定模块,包括:第一确定子模块,用于根据各所述频率子带内各频点的所述频域估计信号,确定所述频域估计信号的分布函数;第二确定子模块,用于根据所述分布函数,确定所述各频点的所述加权系数。在一些实施例中,所述第一确定子模块,具体用于:确定各所述频率子带中各频点的所述频域估计信号与标准差比值的平方;对各所述频率子带中各频点的所述比值的平方求和,确定第一和;获取各所述频率子带对应的所述第一和的开方和,得到第二和;根据所述第二和为变量的指数函数,确定所述分布函数。在一些实施例中,所述第一确定子模块,具体用于:确定各所述频率子带中各频点的所述频域估计信号与标准差之间比值的平方;对各所述频率子带中各频点的所述比值的平方求和,确定第三和;根据各所述频率子带对应的所述第三和的预定次方,确定第四和;根据所述第四和为变量的指数函数,确定所述分布函数。在一些实施例中,所述划分模块,具体用于:将预定的频带范围划分为C个频率子带,其中,C为大于1的整数;所述任意两个相邻的所述频率子带具有重叠频带,包括:第c个所述频率子带的第一个频点小于第c-1个所述频率子带的最后一个频点;其中,c为大于或等于2且小于或等于C。根据本公开实施例的第三方面,提供一种音频信号的处理装置,所述装置至少包括:处理器和用于存储能够在所述处理器上运行的可执行指令的存储器,其中:处理器用于运行所述可执行指令时,所述可执行指令执行上述任一项音频信号的处理方法中的步骤。根据本公开实施例的第四方面,提供一种非临时性计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述任一项音频信号的处理方法中的步骤。本公开的实施例提供的技术方案可以包括以下有益效果:本公开实施例将频带划分为多个频率子带,并且使得相邻的频率子带具有相互重叠的频点。由于频率子带内的各频点的频率值相差小,具有较强的依赖性,而不同频率子带内各频点的频率值相差较大,则具有较弱的依赖性。同时,相邻频率子带间由于具有重叠频点,因此也具有依赖性,实现整个频带的链式结构。通过这种方式,相对于现有技术中,假设所有频点间都存在相同的依赖性的处理方式,能够使得通过加权系数确定的分离矩阵具有更强的分离性能,分离得到的信号更加接近实际情况中,频点间隔越远依赖性越弱,距离间隔越近依赖性越强的特点,从而提升信号分离的准确性,减小了分离后的语音损伤。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。图1是根据一示例性实施例示出的一种音频信号处理方法的流程图一;图2是根据一示例性实施例示出的一种音频信号处理方法的流程图二;图3是根据一示例性实施例示出的一种音本文档来自技高网...

【技术保护点】
1.一种音频信号处理方法,其特征在于,包括:/n由至少两个麦克风获取至少两个声源各自发出的音频信号,以获得所述至少两个麦克风各自的原始带噪信号;/n对于时域上的每一帧,根据所述至少两个麦克风各自的所述原始带噪信号,获取所述至少两个声源各自的频域估计信号;/n将预定的频带范围划分为多个频率子带,其中,每个频率子带包含多个频点,且任意两个相邻的所述频率子带具有重叠频带;/n根据在各所述频率子带内各频点的所述频域估计信号,确定所述频率子带包含的各频点的加权系数;/n根据所述加权系数,确定各频点的分离矩阵;/n基于所述分离矩阵及所述原始带噪信号,获得至少两个声源各自发出的音频信号。/n

【技术特征摘要】
1.一种音频信号处理方法,其特征在于,包括:
由至少两个麦克风获取至少两个声源各自发出的音频信号,以获得所述至少两个麦克风各自的原始带噪信号;
对于时域上的每一帧,根据所述至少两个麦克风各自的所述原始带噪信号,获取所述至少两个声源各自的频域估计信号;
将预定的频带范围划分为多个频率子带,其中,每个频率子带包含多个频点,且任意两个相邻的所述频率子带具有重叠频带;
根据在各所述频率子带内各频点的所述频域估计信号,确定所述频率子带包含的各频点的加权系数;
根据所述加权系数,确定各频点的分离矩阵;
基于所述分离矩阵及所述原始带噪信号,获得至少两个声源各自发出的音频信号。


2.根据权利要求1所述的方法,其特征在于,所述根据各所述频率子带内各频点的所述频域估计信号,确定所述频率子带内包含的各频点的加权系数,包括:
根据各所述频率子带内各频点的所述频域估计信号,确定所述频域估计信号的分布函数;
根据所述分布函数,确定所述各频点的所述加权系数。


3.根据权利要求2所述的方法,其特征在于,所述根据各所述频率子带内各频点的所述频域估计信号,确定所述频域估计信号的分布函数,包括:
确定各所述频率子带中各频点的所述频域估计信号与标准差比值的平方;
对各所述频率子带中各频点的所述比值的平方求和,确定第一和;
获取各所述频率子带对应的所述第一和的开方和,得到第二和;
根据所述第二和为变量的指数函数,确定所述分布函数。


4.根据权利要求2所述的方法,其特征在于,所述根据各所述频率子带内各频点的所述频域估计信号,确定所述频域估计信号的分布函数,包括:
确定各所述频率子带中各频点的所述频域估计信号与标准差之间比值的平方;
对各所述频率子带中各频点的所述比值的平方求和,确定第三和;
根据各所述频率子带对应的所述第三和的预定次方,确定第四和;
根据所述第四和为变量的指数函数,确定所述分布函数。


5.根据权利要求1至4任一所述的方法,其特征在于,所述将预定的频带范围划分为多个频率子带,包括:
将预定的频带范围划分为C个频率子带,其中,C为大于1的整数;
所述任意两个相邻的所述频率子带具有重叠频带,包括:
第c个所述频率子带的第一个频点小于第c-1个所述频率子带的最后一个频点;其中,c为大于或等于2且小于或等于C。


6.一种音频信号处理装置,其特征在于,包括:
第一获取模块,用于由至少两个麦克风获取至少两个声源各自发出的音频信号,以获得所述至少两个麦克风各自的原始带噪信号;
第二获取模块,用于对于...

【专利技术属性】
技术研发人员:侯海宁
申请(专利权)人:北京松果电子有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1