语音信号的处理方法、装置、设备及存储介质制造方法及图纸

技术编号:26344845 阅读:33 留言:0更新日期:2020-11-13 21:02
本发明专利技术公开了一种语音信号的处理方法、装置、设备及存储介质。其中,方法包括:获取参考语音信号;根据参考语音信号,确定参考语音信号协方差以及参考语音信号中的后期混响语音信号的协方差;根据参考语音信号的协方差与后期混响语音信号的协方差,确定目标语音信号的协方差;对目标语音信号的协方差,执行更新操作;其中,更新操作包括:根据目标语音信号的协方差与第一预设阈值,确定目标协方差;根据目标协方差,确定目标语音信号;根据目标语音信号与第一预设阈值,更新目标语音信号的协方差;重复更新操作,直至达到收敛条件;输出达到收敛条件时的目标语音信号。

Speech signal processing method, device, equipment and storage medium

【技术实现步骤摘要】
语音信号的处理方法、装置、设备及存储介质
本专利技术涉及声学
,更具体地,涉及一种语音信号的处理方法、一种语音信号的处理装置、一种电子设备以及一种计算机可读存储介质。
技术介绍
目前,在一些相对封闭的声学环境中使用免提电话、会议电话、助听器等语音控制系统进行通信时,语音控制系统的麦克风采集到的语音信号往往会受到混响的影响,这导致用户听到的语音的清晰度、可读懂度低。因此,如何对麦克风采集的语音信号去混响也显得愈发重要。在对麦克风采集的语音信号去混响时,通常采用多通道线性预测去混响算法。该算法对于期望输出的目标语音信号的协方差的初始化具有重要要求,其属于一个迭代循环的过程。现有的在对目标语音信号的协方差进行初始化时,是将前一次迭代过程中确定出的目标语音信号频域模的平方作为当前迭代过程中目标语音信号的协方差的初始化值。而该方式存在收敛速度慢,以及目标语音信号失真的问题。
技术实现思路
本专利技术的一个目的是提供一种用于处理语音信号的新技术方案。根据本专利技术的第一方面,提供了一种语音信号的处理方法,包括:获取参考语音信号,其中,所述参考语音信号为麦克风阵列中任一路麦克风采集到的语音信号;根据所述参考语音信号,确定所述参考语音信号协方差以及所述参考语音信号中的后期混响语音信号的协方差;根据所述参考语音信号的协方差与所述后期混响语音信号的协方差,确定目标语音信号的协方差;对所述目标语音信号的协方差,执行更新操作;其中,所述更新操作包括:根据所述目标语音信号的协方差与第一预设阈值,确定目标协方差;根据所述目标协方差,确定所述目标语音信号;根据所述目标语音信号与所述第一预设阈值,更新所述目标语音信号的协方差;重复所述更新操作,直至达到收敛条件;输出达到收敛条件时的所述目标语音信号。可选的,所述根据所述参考语音信号,确定所述参考语音信号协方差以及所述参考语音信号中的后期混响语音信号的协方差,包括:根据所述参考语音信号,确定所述参考语音信号的协方差;根据所述参考语音信号的协方差,确定所述参考语音信号中的后期混响语音信号的协方差。可选的,所述方法在所述根据所述参考语音信号,确定所述参考语音信号协方差以及所述参考语音信号中的后期混响语音信号的协方差之后,还包括:对确定出的所述后期混响语音信号的协方差执行递归平均处理,以得到处理后的所述后期混响语音信号的协方差;利用处理后的所述后期混响语音信号的协方差,更新确定出的所述后期混响语音信号的协方差。可选的,所述根据所述目标语音信号的协方差与第一预设阈值,确定目标协方差,包括:将所述目标语音信号的协方差与第一预设阈值中的最大值,确定为所述目标协方差。可选的,所述收敛条件包括:重复所述更新操作的重复次数达到预设次数;或者,当前的目标语音信号与前一次的目标语音信号差值的二范数与所述前一次的目标语音信号的二范数的之间的比值小于第二预设阈值。可选的,所述根据所述目标语音信号与所述第一预设阈值,更新所述目标语音信号的协方差包括:将所述目标语音信号的频域模的平方值与所述第一预设阈值之间的最大值,更新为所述目标语音信号的协方差。根据本专利技术的第二方面,提供了一种语音信号的处理装置,所述装置包括:获取模块,用于获取参考语音信号,其中,所述参考语音信号为麦克风阵列中任一路麦克风采集到的语音信号;第一确定模块,用于根据所述参考语音信号,确定所述参考语音信号协方差以及所述参考语音信号中的后期混响语音信号的协方差;第二确定模块,用于根据所述参考语音信号的协方差与所述后期混响语音信号的协方差,确定目标语音信号的协方差;执行模块,用于对所述目标语音信号的协方差,执行更新操作;其中,所述更新操作包括:根据所述目标语音信号的协方差与第一预设阈值,确定目标协方差;根据所述目标协方差,确定所述目标语音信号;根据所述目标语音信号与所述第一预设阈值,更新所述目标语音信号的协方差;重复模块,用于重复所述更新操作,直至达到收敛条件;输出模块,用于输出达到收敛条件时的所述目标语音信号。可选的,所述第一确定模块包括:第一确定单元,用于根据所述参考语音信号,确定所述参考语音信号的协方差;第二确定单元,用于根据所述参考语音信号的协方差,确定所述参考语音信号中的后期混响语音信号的协方差。根据本专利技术的第三方面,提供了一种电子设备,包括如第二方面中任一项所述的装置;或者,包括存储器和处理器,所述存储器用于存储计算机指令,所述处理器用于从所述存储器中调用所述计算机指令,以执行如第一方面中任一项所述的语音信号的处理方法。根据本专利技术的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时实现根据第一方面中任一项所述的语音信号的处理方法。在本实施示例中,将麦克风阵列中任一路麦克风采集到的语音信号作为参考语音信号;根据参考语音信号,确定参考语音信号协方差以及参考语音信号中的后期混响语音信号的协方差;根据参考语音信号的协方差与后期混响语音信号的协方差,确定目标语音信号的协方差;对目标语音信号的协方差,执行更新操作;其中,更新操作包括:根据目标语音信号的协方差与第一预设阈值,确定目标协方差;根据目标协方差,确定目标语音信号;根据目标语音信号与第一预设阈值,更新目标语音信号的协方差;重复更新操作,直至达到收敛条件;输出达到收敛条件时的目标语音信号。这样,利用第一预设阈值对目标语音信号的协方差进行限制,一方面,可以避免目标语音信号在初始化时接近于0,从而避免了最终输出的目标语音信号的失真。另一方面,可以实现目标语音信号的协方差逼近实际值,这样,在循环迭代过程中,可提高计算最终输出的目标语音信号的收敛速度。通过以下参照附图对本专利技术的示例性实施例的详细描述,本专利技术的其它特征及其优点将会变得清楚。附图说明被结合在说明书中并构成说明书的一部分的附图示出了本专利技术的实施例,并且连同其说明一起用于解释本专利技术的原理。图1是根据本专利技术实施例提供的一种实现语音信号的处理方法的电子设备的硬件配置的框图;图2是本专利技术实施例提供的一种语音信号的处理方法的流程示意图;图3是本专利技术实施例提供的一种语音信号的处理装置的结构示意图;图4是本专利技术实施例提供的一种电子设备的结构示意图。具体实施方式现在将参照附图来详细描述本专利技术的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本专利技术的范围。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本专利技术及其应用或使用的任何限制。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。在这里示出和讨论的所有例子中,任何具本文档来自技高网...

【技术保护点】
1.一种语音信号的处理方法,其特征在于,包括:/n获取参考语音信号,其中,所述参考语音信号为麦克风阵列中任一路麦克风采集到的语音信号;/n根据所述参考语音信号,确定所述参考语音信号协方差以及所述参考语音信号中的后期混响语音信号的协方差;/n根据所述参考语音信号的协方差与所述后期混响语音信号的协方差,确定目标语音信号的协方差;/n对所述目标语音信号的协方差,执行更新操作;其中,所述更新操作包括:根据所述目标语音信号的协方差与第一预设阈值,确定目标协方差;根据所述目标协方差,确定所述目标语音信号;根据所述目标语音信号与所述第一预设阈值,更新所述目标语音信号的协方差;/n重复所述更新操作,直至达到收敛条件;/n输出达到收敛条件时的所述目标语音信号。/n

【技术特征摘要】
1.一种语音信号的处理方法,其特征在于,包括:
获取参考语音信号,其中,所述参考语音信号为麦克风阵列中任一路麦克风采集到的语音信号;
根据所述参考语音信号,确定所述参考语音信号协方差以及所述参考语音信号中的后期混响语音信号的协方差;
根据所述参考语音信号的协方差与所述后期混响语音信号的协方差,确定目标语音信号的协方差;
对所述目标语音信号的协方差,执行更新操作;其中,所述更新操作包括:根据所述目标语音信号的协方差与第一预设阈值,确定目标协方差;根据所述目标协方差,确定所述目标语音信号;根据所述目标语音信号与所述第一预设阈值,更新所述目标语音信号的协方差;
重复所述更新操作,直至达到收敛条件;
输出达到收敛条件时的所述目标语音信号。


2.根据权利要求1所述的方法,其特征在于,所述根据所述参考语音信号,确定所述参考语音信号协方差以及所述参考语音信号中的后期混响语音信号的协方差,包括:
根据所述参考语音信号,确定所述参考语音信号的协方差;
根据所述参考语音信号的协方差,确定所述参考语音信号中的后期混响语音信号的协方差。


3.根据权利要求1所述的方法,其特征在于,所述方法在所述根据所述参考语音信号,确定所述参考语音信号协方差以及所述参考语音信号中的后期混响语音信号的协方差之后,还包括:
对确定出的所述后期混响语音信号的协方差执行递归平均处理,以得到处理后的所述后期混响语音信号的协方差;
利用处理后的所述后期混响语音信号的协方差,更新确定出的所述后期混响语音信号的协方差。


4.根据权利要求1所述的方法,其特征在于,所述根据所述目标语音信号的协方差与第一预设阈值,确定目标协方差,包括:
将所述目标语音信号的协方差与所述第一预设阈值中的最大值,确定为所述目标协方差。


5.根据权利要求1所述的方法,其特征在于,所述收敛条件包括:
重复所述更新操作的重复次数达到预设次数;
或者,当前的目标语音信号与前一次的目标语音信号差值的二范数与...

【专利技术属性】
技术研发人员:何冲
申请(专利权)人:歌尔科技有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1