The invention discloses a sound source positioning method and device, wherein the method includes: calculating the signal received by the microphone array to obtain the spatial spectrum; determining the number of spectral peaks of the spatial spectrum; if the spatial spectrum has multiple spectral peaks, using a fixed beamformer to form a plurality of beams in different directions corresponding to the microphone array, wherein the beams in different directions are at least Including the first direction beam and the second direction beam; calculate the energy of the first direction beam, the second direction beam and the energy difference between the first direction beam and the second direction beam; judge whether the energy difference is greater than or equal to the preset threshold; if the energy difference is greater than or equal to the preset threshold, output the beam with the largest energy between the energy of the first direction beam and the energy of the second direction beam The corresponding angle is the direction of arrival. The scheme provided in the application fully considers the influence of various interference noises, and can realize more accurate sound source positioning.
【技术实现步骤摘要】
声源定位方法和装置
本专利技术属于语音交互
,尤其涉及声源定位方法和装置。
技术介绍
在真实场景中,使用麦克风阵列定位说话人方向的时候,不可避免地会接收到来自其他方向上的干扰,例如电视、音乐等干扰噪声。同时由于供电的限制,麦克风阵列的摆放位置会靠近于墙壁,由墙面引起的反射声波也容易影响到定位的准确度。专利技术人在实现本申请的过程中发现,现有技术的方案至少存在以下缺陷:传统的MUSIC(MultipleSignalClassification,空间谱估计算法)方法虽然可以同时定位出多个声源,但难以区分唤醒方向到底具体的对应哪个角度。传统的GCC-PHAT(GeneralizedCrossCorrelationPHAseTransformation,广义互相关-相位变换方法)方法也难以解决由于墙面反射带来的定位不准问题。
技术实现思路
本专利技术实施例提供一种声源定位方法和装置,用于至少解决上述技术问题之一。第一方面,本专利技术实施例提供一种声源定位方法,包括:对麦克风阵列接收的信号进行计算得到空间谱;确定所述空间谱所具有的谱峰的数量;若所述空间谱具有多个谱峰,使用固定波束形成器形成与麦克风阵列对应的多个不同方向的波束,其中,所述多个不同方向的波束至少包括第一方向波束和第二方向波束;计算所述第一方向波束的能量、所述第二方向波束的能量以及所述第一方向波束和所述第二方向波束的能量差;判断所述能量差是否大于等于预设阈值;若所述能量差大于等于所述预设阈值,输出所述第一方向波束的能量和所述 ...
【技术保护点】
1.一种声源定位方法,包括:/n对麦克风阵列接收的信号进行计算得到空间谱;/n确定所述空间谱所具有的谱峰的数量;/n若所述空间谱具有多个谱峰,使用固定波束形成器形成与麦克风阵列对应的多个不同方向的波束,其中,所述多个不同方向的波束至少包括第一方向波束和第二方向波束;/n计算所述第一方向波束的能量、所述第二方向波束的能量以及所述第一方向波束和所述第二方向波束的能量差;/n判断所述能量差是否大于等于预设阈值;/n若所述能量差大于等于所述预设阈值,输出所述第一方向波束的能量和所述第二方向波束的能量中能量最大的波束所对应的角度为波达方向。/n
【技术特征摘要】
1.一种声源定位方法,包括:
对麦克风阵列接收的信号进行计算得到空间谱;
确定所述空间谱所具有的谱峰的数量;
若所述空间谱具有多个谱峰,使用固定波束形成器形成与麦克风阵列对应的多个不同方向的波束,其中,所述多个不同方向的波束至少包括第一方向波束和第二方向波束;
计算所述第一方向波束的能量、所述第二方向波束的能量以及所述第一方向波束和所述第二方向波束的能量差;
判断所述能量差是否大于等于预设阈值;
若所述能量差大于等于所述预设阈值,输出所述第一方向波束的能量和所述第二方向波束的能量中能量最大的波束所对应的角度为波达方向。
2.根据权利要求1所述的方法,其中,在所述确定所述空间谱所具有的谱峰的数量之后,所述方法还包括:
若所述空间谱仅具有单个谱峰,输出所述单个谱峰所对应的角度为波达方向。
3.根据权利要求2所述的方法,其中,所述方法还包括:
若所述能量差小于所述预设阈值,计算所述第一方向波束的相对延迟和所述第二方向波束的相对延迟;
输出所述第一方向波束的相对延迟和所述第二方向波束的相对延迟中延迟最小的波束所对应的角度为波达方向。
4.根据权利要求1所述的方法,其中,所述对麦克风阵列接收的信号进行计算得到空间谱包括:
使用独立矢量分析得到与多个麦克风接收信号对应的分离矩阵;
计算与能够唤醒设备的唤醒信号对应的分离矩阵的空间谱。
5.根据权利要求4所述的方法,其中,所述使用独立矢量分析得到与多个麦克风接收信号对应的分离矩阵包括:
基于短时傅里叶变换将麦克风阵列接收的信号建模为X(t,f);
使用独立矢量分析矩阵计算分离矩阵W(t,f)对麦克风阵列接收的信号滤波得到声源信号的估计信号Y(t,f),其中,Y(t,f)=W(t,f)*X(t,f);
将所述估计信号送入设备中的...
【专利技术属性】
技术研发人员:夏杰,周强,
申请(专利权)人:苏州思必驰信息科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。