一种声源定位方法和装置及其时延估计方法和装置制造方法及图纸

技术编号：15128067 阅读：79 留言：0更新日期：2017-04-10 07:08

本申请提供了一种声源定位方法和装置及其时延估计方法和装置，该时延估计方法包括：对接收的声源发出的声音信号进行两级降噪处理得到降噪信号；根据所述降噪信号的四阶累积量和四阶累积量互谱，定义时延估计方程；根据所述时延估计方程估计得到所述声音信号到达麦克风阵列中各个麦克风的时间差。该时延估计方法通过采用两级降噪处理以及四阶累积量谱降低了噪声和干扰的影响，准确的估计时延，有效克服了时域高阶统计量和广义互相关-谱加权方法存在的声音信号时延周围由于混淆峰值以及高斯噪声污染的影响导致声源定位误差增大的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及声源定位
，尤其涉及一种声源定位方法和装置及其时延估计方法和装置。
技术介绍
麦克风声源定位技术是利用麦克风拾取声音信号，并用数字信号处理技术对其进行分析和处理，继而确定和跟踪声源的空间位置。针对室内复杂场景，能够实时、准确的估计出声源的位置，以此作为机器人本体进行位姿调整的依据，使得机器人本体能够根据声源位置对位姿进行主动调整，将本体朝向声源位置。如果存在多个声源，能够智能的选择主要声源，抑制次要声源的影响，使机器人的交互功能更加准确、智能、友好。目前，基于时延估计的声源定位中，主要利用时延估计技术得到声源到达各个麦克风的时间差，然后利用时间差结合麦克风阵列的几何位置计算出声源的位置。然而，现有基于时延估计的声源定位方法中，由于非空间相关高斯噪声和声音信号周期性的影响，常用的估计方法，例如时域高阶统计量的方法得到的时延冲击响应函数容易被源信号频谱延展，在信号时延周围产生混淆峰值，因此具有较大的时延估计误差。再例如广义互相关-谱加权的方法，会随着信噪比的逐渐减小而出现噪声时延处的峰值能量越来越大，导致错误的时延估计。时延估计的误差会在声源位置计算中累积并放大，从而影响定位效果。
技术实现思路
有鉴于此，本申请提供了一种声源定位方法和装置及其时延估计方法和装置，以克服现有技术中时域高阶统计量方法和广义互相关-谱加权方法存在的信号时延周围由于混淆峰值以及高斯噪声污染...

【技术保护点】
一种时延估计方法，其特征在于，包括：对接收的声源发出的声音信号进行两级降噪处理得到降噪信号；根据所述降噪信号的四阶累积量和四阶累积量互谱，定义时延估计方程；根据所述时延估计方程估计得到所述声音信号到达麦克风阵列中各个麦克风的时间差。

【技术特征摘要】
1.一种时延估计方法，其特征在于，包括：
对接收的声源发出的声音信号进行两级降噪处理得到降噪信号；
根据所述降噪信号的四阶累积量和四阶累积量互谱，定义时延估计方程；
根据所述时延估计方程估计得到所述声音信号到达麦克风阵列中各个麦
克风的时间差。
2.根据权利要求1所述的时延估计方法，其特征在于，所述对接收的声
源发出的声音信号进行两级降噪处理得到降噪信号包括：
利用通道滤波器进行信号的局部和全局降噪处理，降低所述声音信号中
的噪声干扰，得到初步降噪信号；
将所述初步降噪信号叠加白化权重函数k，降低伪峰幅值，增大时延峰值，
得到降噪信号。
3.根据权利要求1所述的时延估计方法，其特征在于，所述根据所述降
噪信号的四阶累积量谱和四阶累积量互谱，定义时延估计方程包括：
根据所述降噪信号的四阶累积量和四阶累积量谱，定义所述时延估计方
程为：
γ(ω1,ω2,ω3)=kPαβ(ω1,ω2,ω3)Pβα(ω1,ω2,ω3)=eiω1τ,]]>其中，γ(ω1,ω2,ω3)称为时延估计子，表示经过两级降噪之后信号的四阶
累积量和四阶累积量谱；表示白化权重函数；ω1,ω2,ω3是三维傅里叶变换后的自变量，即信号的频率，取值范围是不小于0的实数；
Pβα(ω1,ω2,ω3)表示参考信号α(n)的四阶累积量谱；Pαβ(ω1,ω2,ω3)表示参考信
号α(n)和延迟信号β(n)的四阶累积量互谱；i表示虚数单位；τ表示声音信号
到达麦克风阵列中各个麦克风信号的到达时间差。
4.一种时延估计装置，其特征在于，包括：声音采集单元、处理单元、
定义单元和估计单元，其中，
所述声音采集单元，用于采集声源发出的声音信号；
所述处理单元，用于对所述声音采集单元采集的所述声音信号进行两级
降噪处理得到降噪信号；
所述定义单元，用于根据所述处理单元处理得到的所述降噪信号的四阶
累积量和四阶累积量互谱，定义时延估计方程；
所述估计单元，用于根据所述定义单元定义的所述时延估计方程估计得
到所述声音信号到达麦克风阵列中各个麦克风的时间差。
5.根据权利要求4所述的时延估计装置，其特征在于，所述处理单元包
括：第一处理单元和第二处理单元，其中，
所述第一处理单元，用于利用通道滤波器进行信号的局部和全局降噪处
理，降低所述声音信号中的噪声干扰，得到初步降噪信号；
所述第二处理单元，用于将所述初步降噪信号叠加白化权重函数k，降低
伪峰幅值，增大时延峰值，得到降噪信号。
6.根据权利要求4所述的时延估计装置，其特征在于，所述定义单元具
体用于根据所述降噪信号的四阶累积量和四阶累积量谱，定义所述时延估计
方程为：
γ(ω1,ω2,ω3)=kPαβ(ω1,ω2,ω3)Pβα(ω1,ω2,ω3)=eiω1τ,]]>其中，γ(ω1,ω2,ω3)称为时延估计子，表示经过两级降噪之后信号的四阶
累积量和四阶累积量谱；表示白化权重函数；ω1,ω2,ω3是三维傅里叶变换后的自变量，即信号的频率，取值范围是不小于0的实数；
Pβα(ω1,ω2,ω3)表示参考信号α(n)的四阶累积量谱；Pαβ(ω1,ω2,ω3)表示参考信
号α(n)和延迟信号β(n)的四阶累积量互谱；i表示虚数单位；τ表示声音信号
到达麦克风阵列中各个麦克风信号的到达时间差。
7.一种声源定位方法，其特征在于，包括：
对接收的声源发出的声音信号进行两级降噪处理得到降噪信...

【专利技术属性】
技术研发人员：闵海波，侯博，
申请(专利权)人：苏州宾果智能科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人