音频信号处理方法及装置、存储介质制造方法及图纸

技术编号:24211723 阅读:26 留言:0更新日期:2020-05-20 17:10
本公开是关于一种音频信号处理方法及装置、存储介质。该方法包括:由至少两个麦克风获取至少两个声源各自发出的音频信号,以获得至少两个麦克风各自的原始带噪信号;对于时域上的每一帧,根据至少两个麦克风各自的原始带噪信号,获取至少两个声源各自的频域估计信号;将预定的频带范围划分为多个谐波子集,其中,每个谐波子集包含多个频点数据;根据在各谐波子集内各频点的频域估计信号,确定谐波子集包含的各频点的加权系数;根据加权系数,确定各频点的分离矩阵;基于分离矩阵及原始带噪信号,获得至少两个声源各自发出的音频信号。通过本公开实施例的方法,能够提升音频信号的语音质量。

Audio signal processing method, device and storage medium

【技术实现步骤摘要】
音频信号处理方法及装置、存储介质
本公开涉及信号处理领域,尤其涉及一种音频信号处理方法及装置、存储介质。
技术介绍
相关技术中,智能产品设备拾音多采用麦克风阵列,应用麦克风波束形成技术提高语音信号处理质量,以提高真实环境下的语音识别率。但多个麦克风的波束形成技术对麦克风位置误差敏感,性能影响较大,另外麦克风个数增多了也会导致产品成本升高。因此,目前越来越多的智能产品设备只配置两个麦克风;两个麦克风常采用完全不同于多个麦克风波束形成技术的盲源分离技术对语音进行增强,而如何使得基于盲源分离技术分离后信号的语音质量更高是目前迫切需要解决的问题。
技术实现思路
本公开提供一种音频信号处理方法及装置、存储介质。根据本公开实施例的第一方面,提供一种音频信号处理方法,包括:由至少两个麦克风获取至少两个声源各自发出的音频信号,以获得所述至少两个麦克风各自的原始带噪信号;对于时域上的每一帧,根据所述至少两个麦克风各自的所述原始带噪信号,获取所述至少两个声源各自的频域估计信号;将预定的频带范围划分为多个谐波子集,其中,每个谐波子集包含多个频点数据;根据在各所述谐波子集内各频点的所述频域估计信号,确定所述谐波子集包含的各频点的加权系数;根据所述加权系数,确定各频点的分离矩阵;基于所述分离矩阵及所述原始带噪信号,获得至少两个声源各自发出的音频信号。在一些实施例中,所述根据各所述谐波子集内各频点的所述频域估计信号,确定所述谐波子集内包含的各频点的加权系数,包括:根据各所述谐波子集内各频点的所述频域估计信号,确定所述频域估计信号的分布函数;根据所述分布函数,确定所述各频点的所述加权系数。在一些实施例中,所述根据各所述谐波子集内各频点的所述频域估计信号,确定所述频域估计信号的分布函数,包括:确定各所述谐波子集的频点集合中各频点的所述频域估计信号与标准差比值的平方;对各所述频点集合的各所述比值的平方求和,确定第一和;获取各所述频点集合对应的所述第一和的开方和,得到第二和;根据所述第二和为变量的指数函数,确定所述分布函数。在一些实施例中,所述根据各所述谐波子集内各频点的所述频域估计信号,确定所述频域估计信号的分布函数,包括:确定各所述谐波子集的频点集合中各频点的所述频域估计信号与标准差之间比值的平方;对各所述频点集合的各所述比值的平方求和,确定第三和;根据各所述频点集合对应的所述第三和的预定次方,确定第四和;根据所述第四和为变量的指数函数,确定所述分布函数。在一些实施例中,所述方法还包括:确定各所述谐波子集的基频点、前M个倍频点和各所述倍频点所在的预设带宽内的频点;根据所述基频点、所述前M个倍频点和各所述倍频点所在的预设带宽内的频点组成的集合,确定各所述谐波子集的所述频点集合。在一些实施例中,所述确定各所述谐波子集的基频点、前M个倍频点和各所述倍频点所在的预设带宽内的频点,包括:根据所述预定的频带范围和划分所述谐波子集的预定个数,确定各所述谐波子集的基频点与各基频点对应的前M个倍频点;根据各所述谐波子集的所述基频点与所述前M个倍频点,确定所述预设带宽内的频点。根据本公开的第二方面,提供一种音频信号处理装置,包括:第一获取模块,用于由至少两个麦克风获取至少两个声源各自发出的音频信号,以获得所述至少两个麦克风各自的原始带噪信号;第二获取模块,用于对于时域上的每一帧,根据所述至少两个麦克风各自的所述原始带噪信号,获取所述至少两个声源各自的频域估计信号;划分模块,用于将预定的频带范围划分为多个谐波子集,其中,每个谐波子集包含多个频点数据;第一确定模块,用于根据在各所述谐波子集内各频点的所述频域估计信号,确定所述谐波子集包含的各频点的加权系数;第二确定模块,用于根据所述加权系数,确定各频点的分离矩阵;第三获取模块,用于基于所述分离矩阵及所述原始带噪信号,获得至少两个声源各自发出的音频信号。在一些实施例中,所述第一确定模块,包括:第一确定子模块,用于根据各所述谐波子集内各频点的所述频域估计信号,确定所述频域估计信号的分布函数;第二确定子模块,用于根据所述分布函数,确定所述各频点的所述加权系数。在一些实施例中,所述第一确定子模块,具体用于:确定各所述谐波子集的频点集合中各频点的所述频域估计信号与标准差比值的平方;对各所述频点集合的各所述比值的平方求和,确定第一和;获取各所述频点集合对应的所述第一和的开方和,得到第二和;根据所述第二和为变量的指数函数,确定所述分布函数。在一些实施例中,所述第一确定子模块,具体用于:确定各所述谐波子集的频点集合中各频点的所述频域估计信号与标准差之间比值的平方;对各所述频点集合的各所述比值的平方求和,确定第三和;根据各所述频点集合对应的所述第三和的预定次方,确定第四和;根据所述第四和为变量的指数函数,确定所述分布函数。在一些实施例中,所述装置还包括:第三确定模块,用于确定各所述谐波子集的基频点、前M个倍频点和各所述倍频点所在的预设带宽内的频点;第四确定模块,用于根据所述基频点、所述前M个倍频点和各所述倍频点所在的预设带宽内的频点组成的集合,确定各所述谐波子集的所述频点集合。在一些实施例中,所述第三确定模块,包括:第三确定子模块,用于根据所述预定的频带范围和划分所述谐波子集的预定个数,确定各所述谐波子集的基频点与各基频点对应的前M个倍频点;第四确定子模块,用于根据各所述谐波子集的所述基频点与所述前M个倍频点,确定所述预设带宽内的频点。根据本公开提供的第三方面,提供一种音频信号处理装置,所述装置至少包括:处理器和用于存储能够在所述处理器上运行的可执行指令的存储器,其中:处理器用于运行所述可执行指令时,所述可执行指令执行上述任一项音频信号处理方法中的步骤。根据本公开提供的第四方面,提供一种非临时性计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述任一项音频信号处理方法中的步骤。本公开的实施例提供的技术方案可以包括以下有益效果:本公开实施例根据各谐波子集中各频点对应的频域估计信号,确定加权系数。相对于相关技术中,直接根据各频点确定加权系数的方式,本公开实施例通过划分谐波子集的方式,谐波子集内各频点由倍频点构成谐波结构,使得每个谐波子集内的各频点具有强依赖性。按照谐波子集分别处理,从而实现对整个频带中各频点按照不同的依赖性进行处理。如此,增强了各频点信号分离的准确性,提升了识别性能,减小了分离后的语音损伤。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说本文档来自技高网...

【技术保护点】
1.一种音频信号处理方法,其特征在于,包括:/n由至少两个麦克风获取至少两个声源各自发出的音频信号,以获得所述至少两个麦克风各自的原始带噪信号;/n对于时域上的每一帧,根据所述至少两个麦克风各自的所述原始带噪信号,获取所述至少两个声源各自的频域估计信号;/n将预定的频带范围划分为多个谐波子集,其中,每个谐波子集包含多个频点数据;/n根据在各所述谐波子集内各频点的所述频域估计信号,确定所述谐波子集包含的各频点的加权系数;/n根据所述加权系数,确定各频点的分离矩阵;/n基于所述分离矩阵及所述原始带噪信号,获得至少两个声源各自发出的音频信号。/n

【技术特征摘要】
1.一种音频信号处理方法,其特征在于,包括:
由至少两个麦克风获取至少两个声源各自发出的音频信号,以获得所述至少两个麦克风各自的原始带噪信号;
对于时域上的每一帧,根据所述至少两个麦克风各自的所述原始带噪信号,获取所述至少两个声源各自的频域估计信号;
将预定的频带范围划分为多个谐波子集,其中,每个谐波子集包含多个频点数据;
根据在各所述谐波子集内各频点的所述频域估计信号,确定所述谐波子集包含的各频点的加权系数;
根据所述加权系数,确定各频点的分离矩阵;
基于所述分离矩阵及所述原始带噪信号,获得至少两个声源各自发出的音频信号。


2.根据权利要求1所述的方法,其特征在于,所述根据各所述谐波子集内各频点的所述频域估计信号,确定所述谐波子集内包含的各频点的加权系数,包括:
根据各所述谐波子集内各频点的所述频域估计信号,确定所述频域估计信号的分布函数;
根据所述分布函数,确定所述各频点的所述加权系数。


3.根据权利要求2所述的方法,其特征在于,所述根据各所述谐波子集内各频点的所述频域估计信号,确定所述频域估计信号的分布函数,包括:
确定各所述谐波子集的频点集合中各频点的所述频域估计信号与标准差比值的平方;
对各所述频点集合的各所述比值的平方求和,确定第一和;
获取各所述频点集合对应的所述第一和的开方和,得到第二和;
根据所述第二和为变量的指数函数,确定所述分布函数。


4.根据权利要求2所述的方法,其特征在于,所述根据各所述谐波子集内各频点的所述频域估计信号,确定所述频域估计信号的分布函数,包括:
确定各所述谐波子集的频点集合中各频点的所述频域估计信号与标准差之间比值的平方;
对各所述频点集合的各所述比值的平方求和,确定第三和;
根据各所述频点集合对应的所述第三和的预定次方,确定第四和;
根据所述第四和为变量的指数函数,确定所述分布函数。


5.根据权利要求3或4所述的方法,其特征在于,所述方法还包括:
确定各所述谐波子集的基频点、前M个倍频点和各所述倍频点所在的预设带宽内的频点;
根据所述基频点、所述前M个倍频点和各所述倍频点所在的预设带宽内的频点组成的集合,确定各所述谐波子集的所述频点集合。


6.根据权利要求5所述的方法,其特征在于,所述确定各所述谐波子集的基频点、前M个倍频点和各所述倍频点所在的预设带宽内的频点,包括:
根据所述预定的频带范围和划分所述谐波子集的预定个数,确定各所述谐波子集的基频点与各基频点对应的前M个倍频点;
根据各所述谐波子集的所述基频点与所述前M个倍频点,确定所述预设带宽内的频点。


7.一种音频信号处理装置,其特征在于,包括:
第一获取模块,用于由至少两个麦克风获取至少两个声源各自发出的音频信号,以获得所述至少两个麦克风各自的原始带噪信号;
第二获取模块,用于对于时域上的每一帧,根...

【专利技术属性】
技术研发人员:侯海宁
申请(专利权)人:北京松果电子有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1