声源定位方法和装置制造方法及图纸

技术编号:29131382 阅读:44 留言:0更新日期:2021-07-02 22:26
本申请公开了一种声源定位方法和装置,属于通信技术领域。该方法主要包括接收目标音频信号,目标音频信号包括噪声音频信号;根据目标音频信号,确定与目标音频信号对应的第一信号空间谱,第一信号空间谱用于表征目标音频信号的音频信号空间能量的分布状态;通过噪声音频信号对应的噪声空间谱,对第一信号空间谱进行去干扰处理,得到第二信号空间谱;根据第二信号空间谱中目标谱峰的方向,对目标音频信号进行定位。

【技术实现步骤摘要】
声源定位方法和装置
本申请属于通信
,具体涉及一种声源定位方法、装置、电子设备及存储介质。
技术介绍
在各种通讯设备及语音交互系统中,声源定位可以使拾音系统对其接收的信号进行声源跟踪,准确的声源定位可有效提高嘈杂背景下的语音通信质量。目前,声源定位通常根据麦克风阵列接收到的信号,得到空间谱,对空间谱进行谱峰搜索,这样,谱峰所对应的方向即为声源方向。但是,在一些干扰因素如环境噪声较多的情况下,得到的空间谱不稳定,导致确定的声源方向不准确。
技术实现思路
本申请实施例的目的是提供一种声源定位方法、装置、电子设备及存储介质,能够解决目前声源定位不准确的问题。第一方面,本申请实施例提供了一种声源定位方法,该方法可以包括:接收目标音频信号,目标音频信号包括噪声音频信号;根据目标音频信号,确定与目标音频信号对应的第一信号空间谱,第一信号空间谱用于表征目标音频信号的音频信号空间能量的分布状态;通过噪声音频信号对应的噪声空间谱,对第一信号空间谱进行去干扰处理,得到第二信号空间谱;根据第二信号空间谱中目标谱峰的方向,对目标音频信号进行定位。第二方面,本申请实施例提供了一种声源定位装置,该装置可以包括:接收模块,用于接收目标音频信号,目标音频信号包括噪声音频信号;第一确定模块,用于根据目标音频信号,确定与目标音频信号对应的第一信号空间谱,第一信号空间谱用于表征目标音频信号的音频信号空间能量的分布状态;处理模块,用于通过噪声音频信号对应的噪声空间谱,对第一信号空间谱进行去干扰处理,得到第二信号空间谱;定位模块,用于根据第二信号空间谱中目标谱峰的方向,对目标音频信号进行定位。第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序或指令,程序或指令被处理器执行时实现如第一方面所示的声源定位方法的步骤。第四方面,本申请实施例提供了一种可读存储介质,可读存储介质上存储程序或指令,程序或指令被处理器执行时实现如第一方面所示的声源定位方法的步骤。第五方面,本申请实施例提供了一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现如第一方面所示的声源定位方法的步骤。在本申请实施例中,通过对获取的目标音频信号对应的第一信号空间谱进行去干扰处理,得到第二信号空间谱,再根据第二信号空间谱中目标谱峰的方向,定位目标音频信号。这样,在初步求得第一信号空间谱的同时,确定目标音频信号中噪声音频信号对应的噪声空间谱,通过噪声音频信号对应的噪声空间谱对第一信号空间谱进行去干扰处理,得到第二信号空间谱。然后,对第二信号空间谱进行谱峰搜索,并将第二信号空间谱中的目标谱峰对应的方向确定为输出目标音频信号的方向,由此,提升信号空间谱的精准度和声源方向判断的准确性。附图说明图1为本申请实施例提供的一种声源定位架构示意图;图2为本申请实施例提供的另一种拾音设备的结构示意图;图3为本申请实施例提供的一种声源定位方法的流程图;图4为本申请实施例提供的一种确定噪声音频信号的流程图;图5为本申请实施例提供的一种未经过去干扰处理的信号空间图的示意图;图6为本申请实施例提供的一种经过去干扰处理的信号空间图的示意图;图7为本申请实施例提供的一种声源定位装置的结构示意图;图8为本申请实施例提供的一种电子设备的结构示意图;图9为本申请实施例提供的一种电子设备的硬件结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。基于此,下面结合附图1-图2,通过具体的实施例及其应用场景对本申请实施例提供的声源定位方法进行详细地说明。本申请实施例提出一种声源定位架构,如图1所示,该声源定位架构可以包括拾音设备和音频输出对象。其中,拾音设备可以包括电子设备、监视器、录像机、定位器等包括拾音系统,并根据拾音系统进行声源定位的设备;音频输出对象可以包括人、播放器等任何可以进行音频(语音)输出的对象。基于该声源定位架构,对本申请实施例提供的声源定位方法的应用场景进行说明。拾音设备以电子设备、音频输出对象以人即用户为例对本申请实施例中的声源定位方法进行说明。这样,如图2所示,在用户通过电子设备与其他用户进行视频通话或者语音通话时,准确的声源定位可有效提高嘈杂背景下的语音通信质量。由此,声源定位尤为重要,本申请实施例提供的声源定位方法可以通过电子设备中的收音器如麦克风接收目标音频信号,目标音频信号包括噪声音频信号。接着,电子设备中的处理器可以根据目标音频信号,确定与目标音频信号对应的第一信号空间谱,第一信号空间谱用于表征目标音频信号的音频信号空间能量的分布状态;以及,通过噪声音频信号对应的噪声空间谱,对第一信号空间谱进行去干扰处理,得到第二信号空间谱。然后,电子设备中的处理器可以根据第二信号空间谱中目标谱峰的方向,对目标音频信号进行定位。这样,在初步求得第一信号空间谱的同时,确定目标音频信号中噪声音频信号对应的噪声空间谱,通过噪声音频信号对应的噪声空间谱对第一信号空间谱进行去干扰处理,得到第二信号空间谱。然后,对第二信号空间谱进行谱峰搜索,并将第二信号空间谱中的目标谱峰对应的方向确定为输出目标音频信号的方向,由此,提升信号空间谱的精准度和声源方向判断的准确性,以进一步地提高嘈杂背景下的语音通信质量。需要说明的是,本申请实施例提供的声源定位方法除了可以应用于上述涉及的用户通过电子设备与其他用户进行视频通话或者语音通话的场景,还可以应用于根据声源定位识别用户,以进行用户身份识别的场景,在此,本申请实施例提供的声源定位方法可以应用于任何可以进行声源定位的场景。根据上述应用场景,下面结合图2对本申请实施例提供的声源定位方法进行详细说明。图2为本申请实施例提供的一种声源定位方法的流程图。如图2所示,该声源定位方法可以应用于电子设备,基于此,具体可以包括如下步骤:步骤210,接收目标音频信号,目标音频信号包括噪声音频信号。步骤220,根据目标音频信号,确定与目标音频信号对应的第一信号空间谱,第一信号空间谱用于表征目标音频信号的音本文档来自技高网...

【技术保护点】
1.一种声源定位方法,其特征在于,包括:/n接收目标音频信号,所述目标音频信号包括噪声音频信号;/n根据所述目标音频信号,确定与所述目标音频信号对应的第一信号空间谱,所述第一信号空间谱用于表征所述目标音频信号的音频信号空间能量的分布状态;/n通过所述噪声音频信号对应的噪声空间谱,对所述第一信号空间谱进行去干扰处理,得到第二信号空间谱;/n根据所述第二信号空间谱中目标谱峰的方向,对所述目标音频信号进行定位。/n

【技术特征摘要】
1.一种声源定位方法,其特征在于,包括:
接收目标音频信号,所述目标音频信号包括噪声音频信号;
根据所述目标音频信号,确定与所述目标音频信号对应的第一信号空间谱,所述第一信号空间谱用于表征所述目标音频信号的音频信号空间能量的分布状态;
通过所述噪声音频信号对应的噪声空间谱,对所述第一信号空间谱进行去干扰处理,得到第二信号空间谱;
根据所述第二信号空间谱中目标谱峰的方向,对所述目标音频信号进行定位。


2.根据权利要求1所述的方法,其特征在于,所述根据所述目标音频信号,确定与所述目标音频信号对应的第一信号空间谱,包括:
通过声源方位估计算法,计算所述目标音频信号的音频信号空间能量的分布状态;
根据所述目标音频信号的音频信号空间能量的分布状态,得到与所述目标音频信号对应的第一信号空间谱;
其中,所述声源方位估计算法包括下述中的至少一种:到达时间差算法、最大输出功率算法、多信号分类算法。


3.根据权利要求1或2所述的方法,其特征在于,所述得到第二信号空间谱之前,所述方法还包括:
根据所述目标音频信号,确定所述目标音频信号中每个频点的频点信息,所述频点信息用于表征所述频点存在语音的概率;
根据所述频点信息,确定所述目标音频信号中的噪声音频信号。


4.根据权利要求3所述的方法,其特征在于,所述目标音频信号包括多个音频帧,所述多个音频帧的每个音频帧包括多个频点;所述根据所述频点信息,确定所述目标音频信号中的噪声音频信号,包括:
根据所述音频帧中的多个频点,计算与所述音频帧的平均频点信息,所述平均频点信息用于表征所述音频帧存在语音的平均概率;
在所述音频帧的平均频点信息满足预设频点信息的情况下,确定所述音频帧为与所述噪声音频信号对应的噪声音频帧。


5.根据权利要求1所述的方法,其特征在于,所述根据所述第二信号空间谱中目标谱峰的方向,对所述目标音频信号进行定位,包括:
对所述第二信号空间谱进行谱峰搜索,得到所述第二信号空间谱中的目标谱峰;
以接收所述目标音频信号的设备为坐标原点,计算所述目标谱峰的最大峰值所对应的坐标方向;
将所述坐标方向确定为输出所述目标音频信...

【专利技术属性】
技术研发人员:周美林杨闳博
申请(专利权)人:维沃移动通信有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1