声源定位方法和装置制造方法及图纸

技术编号:22783022 阅读:28 留言:0更新日期:2019-12-11 03:54
本发明专利技术公开声源定位方法和装置,其中,方法包括:对麦克风阵列接收的信号进行计算得到空间谱;确定空间谱所具有的谱峰的数量;若空间谱具有多个谱峰,使用固定波束形成器形成与麦克风阵列对应的多个不同方向的波束,其中,所述多个不同方向的波束至少包括第一方向波束和第二方向波束;计算第一方向波束的能量、第二方向波束的能量以及第一方向波束和第二方向波束的能量差;判断能量差是否大于等于预设阈值;若能量差大于等于预设阈值,输出第一方向波束的能量和第二方向波束的能量中能量最大的波束所对应的角度为波达方向。本申请的提供的方案充分考虑到各种干扰噪声的影响,能够实现更精准地声源定位。

Sound source location method and device

The invention discloses a sound source positioning method and device, wherein the method includes: calculating the signal received by the microphone array to obtain the spatial spectrum; determining the number of spectral peaks of the spatial spectrum; if the spatial spectrum has multiple spectral peaks, using a fixed beamformer to form a plurality of beams in different directions corresponding to the microphone array, wherein the beams in different directions are at least Including the first direction beam and the second direction beam; calculate the energy of the first direction beam, the second direction beam and the energy difference between the first direction beam and the second direction beam; judge whether the energy difference is greater than or equal to the preset threshold; if the energy difference is greater than or equal to the preset threshold, output the beam with the largest energy between the energy of the first direction beam and the energy of the second direction beam The corresponding angle is the direction of arrival. The scheme provided in the application fully considers the influence of various interference noises, and can realize more accurate sound source positioning.

【技术实现步骤摘要】
声源定位方法和装置
本专利技术属于语音交互
,尤其涉及声源定位方法和装置。
技术介绍
在真实场景中,使用麦克风阵列定位说话人方向的时候,不可避免地会接收到来自其他方向上的干扰,例如电视、音乐等干扰噪声。同时由于供电的限制,麦克风阵列的摆放位置会靠近于墙壁,由墙面引起的反射声波也容易影响到定位的准确度。专利技术人在实现本申请的过程中发现,现有技术的方案至少存在以下缺陷:传统的MUSIC(MultipleSignalClassification,空间谱估计算法)方法虽然可以同时定位出多个声源,但难以区分唤醒方向到底具体的对应哪个角度。传统的GCC-PHAT(GeneralizedCrossCorrelationPHAseTransformation,广义互相关-相位变换方法)方法也难以解决由于墙面反射带来的定位不准问题。
技术实现思路
本专利技术实施例提供一种声源定位方法和装置,用于至少解决上述技术问题之一。第一方面,本专利技术实施例提供一种声源定位方法,包括:对麦克风阵列接收的信号进行计算得到空间谱;确定所述空间谱所具有的谱峰的数量;若所述空间谱具有多个谱峰,使用固定波束形成器形成与麦克风阵列对应的多个不同方向的波束,其中,所述多个不同方向的波束至少包括第一方向波束和第二方向波束;计算所述第一方向波束的能量、所述第二方向波束的能量以及所述第一方向波束和所述第二方向波束的能量差;判断所述能量差是否大于等于预设阈值;若所述能量差大于等于所述预设阈值,输出所述第一方向波束的能量和所述第二方向波束的能量中能量最大的波束所对应的角度为波达方向。第二方面,本专利技术实施例提供一种声源定位装置,包括:空间谱计算模块,配置为对麦克风阵列接收的信号进行计算得到空间谱;谱峰数量确定模块,配置为确定所述空间谱所具有的谱峰的数量;波束形成模块,配置为若所述空间谱具有多个谱峰,使用固定波束形成器形成与麦克风阵列对应的多个不同方向的波束,其中,所述多个不同方向的波束至少包括第一方向波束和第二方向波束;能量计算模块,配置为计算所述第一方向波束的能量、所述第二方向波束的能量以及所述第一方向波束和所述第二方向波束的能量差;判断模块,配置为判断所述能量差是否大于等于预设阈值;第一输出模块,配置为若所述能量差大于等于所述预设阈值,输出所述第一方向波束的能量和所述第二方向波束的能量中能量最大的波束所对应的角度为波达方向。第三方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例的声源定位方法的步骤。第四方面,本专利技术实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行本专利技术任一实施例的声源定位方法的步骤。本申请的方法和装置提供的方案先计算得到空间谱,再根据空间谱中所具有的谱峰的数量,即可判断是否存在反射声波束,如果有多个谱峰,说明存在反射声波束,此时就需要再进行一些别的计算排除反射声波束的干扰,才能最终确定比较准确的直达声波束,而直达声波束对应的方向即为声源的波达方向。因为直达声波束能量较大,一般都会与反射声波束存在一个能量差,当这个能量差超过阈值时,其中能量较大的那个波束就可以确定为直达声波束,该直达声波束对应的波束方向即为声源的波达方向。因此,通过本申请的方案可以准确地计算出声源的波达方向。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一实施例提供的一种声源定位方法的流程图;图2为本专利技术一实施例提供的另一种声源定位方法的流程图;图3为本专利技术一实施例提供的一种声源定位方法的一个具体示例的流程图;图4为本专利技术一实施例提供的一种声源定位装置的框图;图5是本专利技术一实施例提供的电子设备的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参考图1,其示出了本申请的声源定位方法一实施例的流程图,本实施例的声源定位方法可以适用于具备语音唤醒、识别、理解和反馈能力的终端、如智能语音电视、智能音箱、智能对话玩具以及其他现有的具备语音唤醒能力的智能语音终端等。如图1所示,在步骤101中,对麦克风阵列接收的信号进行计算得到空间谱;在步骤102中,确定空间谱所具有的谱峰的数量;在步骤103中,若空间谱具有多个谱峰,使用固定波束形成器形成与麦克风阵列对应的多个不同方向的波束,其中,多个不同方向的波束至少包括第一方向波束和第二方向波束;在步骤104中,计算第一方向波束的能量、第二方向波束的能量以及第一方向波束和第二方向波束的能量差;在步骤105中,判断能量差是否大于等于预设阈值;在步骤106中,若能量差大于等于预设阈值,输出第一方向波束的能量和第二方向波束的能量中能量最大的波束所对应的角度为波达方向。在本实施例中,对于步骤101,声源定位装置对麦克风阵列接收的信号进行计算得到空间谱。之后,对于步骤102,声源定位装置确定空间谱所具有的谱峰的数量,其中,谱峰的数量包括单个谱峰和多个谱峰。之后。对于步骤103,若声源定位装置检测到空间谱具有多个谱峰,使用固定波束形成器形成与麦克风阵列对应的多个不同方向的波束,其中,多个不同方向的波束至少包括第一方向波束和第二方向波束。其中,多个方向的波束可能包括不只两个方向的波束,此处只是泛泛地将其分为第一方向波束和第二方向波束,分别代表的是直达声波束和反射声波束中的任一种,本申请在此没有限制,后续不再赘述。之后,对于步骤104,声源定位装置计算第一方向波束的能量、第二方向波束的能量以及第一方向波束和第二方向波束的能量差。然后,对于步骤105,声源定位装置判断第一方向波束和第二方向波束的能量差是否大于等于预设阈值。最后,对于步骤106,若能量差大于等于预设阈值,输出第一方向波束的能量和第二方向波束的能量中能量最大的波束所对应的角度为波达方向。本实施例的方法通过先计算得到空间谱,再根据空间谱中所具有的谱峰的数量,即可判断是否存在反射声波束,如果有多个谱峰,说明存在反射声波束,此时就需要再进行一些别的计算排除反射声波束的干扰,才能最终确定比较准确的直达声波束,而直达声波束对应的方向即为声源的波达方向。因为直本文档来自技高网...

【技术保护点】
1.一种声源定位方法,包括:/n对麦克风阵列接收的信号进行计算得到空间谱;/n确定所述空间谱所具有的谱峰的数量;/n若所述空间谱具有多个谱峰,使用固定波束形成器形成与麦克风阵列对应的多个不同方向的波束,其中,所述多个不同方向的波束至少包括第一方向波束和第二方向波束;/n计算所述第一方向波束的能量、所述第二方向波束的能量以及所述第一方向波束和所述第二方向波束的能量差;/n判断所述能量差是否大于等于预设阈值;/n若所述能量差大于等于所述预设阈值,输出所述第一方向波束的能量和所述第二方向波束的能量中能量最大的波束所对应的角度为波达方向。/n

【技术特征摘要】
1.一种声源定位方法,包括:
对麦克风阵列接收的信号进行计算得到空间谱;
确定所述空间谱所具有的谱峰的数量;
若所述空间谱具有多个谱峰,使用固定波束形成器形成与麦克风阵列对应的多个不同方向的波束,其中,所述多个不同方向的波束至少包括第一方向波束和第二方向波束;
计算所述第一方向波束的能量、所述第二方向波束的能量以及所述第一方向波束和所述第二方向波束的能量差;
判断所述能量差是否大于等于预设阈值;
若所述能量差大于等于所述预设阈值,输出所述第一方向波束的能量和所述第二方向波束的能量中能量最大的波束所对应的角度为波达方向。


2.根据权利要求1所述的方法,其中,在所述确定所述空间谱所具有的谱峰的数量之后,所述方法还包括:
若所述空间谱仅具有单个谱峰,输出所述单个谱峰所对应的角度为波达方向。


3.根据权利要求2所述的方法,其中,所述方法还包括:
若所述能量差小于所述预设阈值,计算所述第一方向波束的相对延迟和所述第二方向波束的相对延迟;
输出所述第一方向波束的相对延迟和所述第二方向波束的相对延迟中延迟最小的波束所对应的角度为波达方向。


4.根据权利要求1所述的方法,其中,所述对麦克风阵列接收的信号进行计算得到空间谱包括:
使用独立矢量分析得到与多个麦克风接收信号对应的分离矩阵;
计算与能够唤醒设备的唤醒信号对应的分离矩阵的空间谱。


5.根据权利要求4所述的方法,其中,所述使用独立矢量分析得到与多个麦克风接收信号对应的分离矩阵包括:
基于短时傅里叶变换将麦克风阵列接收的信号建模为X(t,f);
使用独立矢量分析矩阵计算分离矩阵W(t,f)对麦克风阵列接收的信号滤波得到声源信号的估计信号Y(t,f),其中,Y(t,f)=W(t,f)*X(t,f);
将所述估计信号送入设备中的...

【专利技术属性】
技术研发人员:夏杰周强
申请(专利权)人:苏州思必驰信息科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1