语音信号处理方法、装置、计算机可读介质及电子设备制造方法及图纸

技术编号:24965276 阅读:28 留言:0更新日期:2020-07-21 15:09
公开了一种语音信号处理方法、装置、计算机可读介质及电子设备,包括:获取声源位置信息和来自传声器阵列的至少两路声音信号;根据所述声源位置信息,从所述至少两路声音信号中抑制来自声源方向的声音信号,以获得所述传声器阵列的噪声参考信号;根据所述声源位置信息,从所述至少两路声音信号中获取来自声源方向的声音信号,以得到语音参考信号;基于所述噪声参考信号,去除所述语音参考信号中残留的噪声信号,以得到期望语音信号。结合声源位置信息,一方面抑制声源方向的声音信号以得到噪声参考信号,另一方面,获取声源方向的声音信号以得到语音参考信号,进而从语音参考信号中去除噪声信号,以实现降低噪声干扰,提升语音增强效果的目的。

【技术实现步骤摘要】
语音信号处理方法、装置、计算机可读介质及电子设备
本专利技术涉及语音增强
,具体涉及一种语音信号处理方法、装置、计算机可读介质及电子设备。
技术介绍
车载智能设备的普及使得语音技术在现代生活中得到了前所未有的发展,而语音作为信息传递的重要载体,其质量是否能得以保障会影响到达人耳的听觉效果或者语音处理系统的处理效果。在实际环境(例如,车载系统)中,由于受到环境噪声、混响以及干扰等因素的影响,传声器阵列拾取的语音信号的质量的会明显下降。语音分离技术则以提高语音质量为出发点,有效地对噪声进行抑制,从而增强封闭环境下的带噪语音信号的质量,尽可能地恢复出原始的纯净语音信号。在现有技术中,主要使用BSS(BlindSourceSeparation,盲信号分离)算法或者GSC(GeneralizedSidelobeCanceller,广义旁瓣对消器)进行语音分离,但由于语音信号的时延及空间滤波效应,使得BSS或者GSC对期望语音信号进行分离可能出现噪声干扰较大或期望语音信号泄露等问题,从而使得分离出的语音的质量也不够理想。
技术实现思路
为了解决上述技术问题,提出了本申请。根据本申请的一个方面,提供了一种语音信号处理方法,包括:获取声源位置信息和来自传声器阵列的至少两路声音信号;根据所述声源位置信息,从所述至少两路声音信号中抑制来自声源方向的语音信号,以获得所述传声器阵列的噪声参考信号;根据所述声源位置信息,从所述至少两路声音信号中获取来自声源方向的语音信号,以得到语音参考信号;基于所述噪声参考信号,去除所述语音参考信号中残留的噪声信号,以得到期望语音信号。根据本申请的另一个方面,提供了一种语音信号处理装置,包括:第一获取模块,用于获取声源位置信息和来自传声器阵列的至少两路声音信号;声源抑制模块,用于根据所述声源位置信息,从所述至少两路声音信号中抑制来自声源方向的语音信号,以获得所述传声器阵列的噪声参考信号;声源增强模块,用于根据所述声源位置信息,从所述至少两路声音信号中获取来自声源方向的语音信号,以得到语音参考信号;降噪模块,用于基于所述噪声参考信号,去除所述语音参考信号中残留的噪声信号,以得到期望语音信号。根据本申请的另一个方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述任一所述的方法。根据本申请的另一个方面,提供了一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于执行上述任一所述的方法。本申请实施例提供的语音信号处理方法、装置、计算机可读介质及电子设备,结合声源位置信息,一方面抑制声源方向的声音信号以得到噪声参考信号,另一方面,获取声源方向的声音信号以得到语音参考信号,进而从语音参考信号中去除噪声信号,以实现降低噪声干扰,提升语音增强效果的目的。附图说明通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。图1是本申请第一示例性实施例提供的语音信号处理方法的流程示意图。图2是本申请第二示例性实施例提供的语音信号处理方法的流程示意图。图3是本申请第三示例性实施例提供的语音信号处理方法的流程示意图。图4是本申请一示例性实施例提供的系统结构图。图5是本申请第四示例性实施例提供的语音信号处理方法的流程示意图。图6是本申请另一示例性实施例提供的系统结构图。图7是本申请第一示例性实施例提供的语音信号处理装置的结构示意图。图8是本申请第二示例性实施例提供的语音信号处理装置的结构示意图。图9是本申请第三示例性实施例提供的语音信号处理装置的结构示意图。图10是本申请第四示例性实施例提供的语音信号处理装置的结构示意图。图11是本申请第五示例性实施例提供的语音信号处理装置的结构示意图。图12是本申请一示例性实施例提供的电子设备的结构图。具体实施方式下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。在语音增强
中,从在嘈杂环境(例如,在该环境中包括了音乐、车辆行驶噪声以及多个说话人的声音)中分离提取期望说话人的语音信号是语音增强系统极具挑战性的问题之一。在现有技术中,采用盲信号分离(BlindSourceSeparation,BSS)系统或广义旁瓣相消器(GeneralizedSidelobeCanceller,GSC)来识别和增强来自特定声源方向的语音信号,从而得到期望说话人的语音信号。但是,当声源数目多于传声器数目时,盲信号分离系统的分离性能的稳定性较差,得到的期望语音信号的噪声干扰太大,而广义旁瓣相消器的阻塞矩阵设计较为复杂,且现有使用自由场声传播模型设计的阻塞矩阵,会引起期望方向的信号泄露。在本申请中,结合声源位置信息,将噪声信号与来自声源方向的声音信号分离开,且基于分离出的噪声信号去除来自声源方向的声音信号中残留的噪声,以实现降低噪声干扰,提升语音增强效果的目的,从而提取出信号质量较好的期望语音信号。图1是本申请第一示例性实施例提供的语音信号处理方法的流程示意图。本实施例可应用在电子设备上,如图1所示,可以包括如下步骤:步骤101,获取声源位置信息和来自传声器阵列的至少两路声音信号。其中,声源位置信息可以通过图像识别的方法获取到。示例性地,可以通过图像采集装置进行图像采集,再对采集到的图像进行图像识别,以确定每个声源的位置,从而形成声源位置信息。声源位置信息可以包括声源相对于传声器阵列的距离信息、角度信息,或者距离信息和角度信息的结合。传声器阵列由在空间中按一定几何尺寸排列的若干个传声器组成。传声器阵列可以从环境中采集到声源的空域和时/频信息,以将这些空域和时/频信息作为声音信号,用于后续实现声源的定位和跟踪。在本申请中,可以从传声器阵列获取到至少两路声音信号,这些声音信号来自于多个声源。示例性地,在车载环境中,声音信号可以包括来自音乐播放器、人说话的声音及环境中的其他声音等。步骤102,根据声源位置信息,从至少两路声音信号中抑制来自声源方向的声音信号,以获得传声器阵列的噪声参考信号。在本申请中,声源位置信息可以用以确定声源的方向,从而可以从传声器阵列的至少两路声音信号中确定出来自声源方向的声源信号,进而抑制该来自声源方向的声音信号,得到传声器阵列的噪声信号,以作为本申请中的噪声参考信号。步骤103,根据声源位置信息,从至少两路声音信号中获取来自声源方向的声音信号,以得到语音参考信号。在本步骤中,根据声源位置本文档来自技高网
...

【技术保护点】
1.一种语音信号处理方法,包括:/n获取声源位置信息和来自传声器阵列的至少两路声音信号;/n根据所述声源位置信息,从所述至少两路声音信号中抑制来自声源方向的声音信号,以获得所述传声器阵列的噪声参考信号;/n根据所述声源位置信息,从所述至少两路声音信号中获取来自声源方向的声音信号,以得到语音参考信号;/n基于所述噪声参考信号,去除所述语音参考信号中残留的噪声信号,以得到期望语音信号。/n

【技术特征摘要】
1.一种语音信号处理方法,包括:
获取声源位置信息和来自传声器阵列的至少两路声音信号;
根据所述声源位置信息,从所述至少两路声音信号中抑制来自声源方向的声音信号,以获得所述传声器阵列的噪声参考信号;
根据所述声源位置信息,从所述至少两路声音信号中获取来自声源方向的声音信号,以得到语音参考信号;
基于所述噪声参考信号,去除所述语音参考信号中残留的噪声信号,以得到期望语音信号。


2.根据权利要求1所述的方法,其中,所述根据所述声源位置信息,从所述至少两路声音信号中抑制来自声源方向的语音信号,以获得所述传声器阵列的噪声参考信号,包括:
对所述至少两路声音信号进行快速傅立叶变换,得到语音信号矩阵;
基于所述语音信号矩阵,通过预设的带方向约束的盲源分离算法,确定所述传声器阵列的噪声参考信号,其中,所述预设的带方向约束的盲源分离算法根据所述声源位置信息确定。


3.根据权利要求2所述的方法,其中,所述基于所述语音信号矩阵,通过预设的所述带方向约束的盲源分离算法,确定所述传声器阵列的噪声参考信号包括:
根据所述声源位置信息和语音信号矩阵,确定所述声源方向的导向向量;
根据所述导向向量确定第一滤波器,所述第一滤波器用于抑制所述声源方向的语音信号;
将所述第一滤波器作为所述带方向约束的盲源分离算法的第一组分离滤波器初值,以输出所述传声器阵列的噪声参考信号。


4.根据权利要求2所述的方法,其中,根据所述声源位置信息,从所述至少两路声音信号中获取来自声源方向的语音信号,以获得语音参考信号,包括:
根据所述声源位置信息和语音信号矩阵,确定所述声源方向的导向向量;
根据所述导向向量确定第二滤波器,所述第二滤波器用于增强所述声源方向的语音信号;
将所述第二滤波器作为所述带方向约束的盲源分离算法的第二组分离滤波器初值,以输出所述语音参考信号。


5.根据权利要求1中所述的方法,其中,所述方法还包括:
获取所述传声器阵列的位置信息;
所述根据所述声源位置信息,从所述至少两路声音信号中获取来自...

【专利技术属性】
技术研发人员:胡玉祥
申请(专利权)人:北京地平线机器人技术研发有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1