声源定位方法和装置制造方法及图纸

技术编号：3922696 阅读：185 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及一种声源定位方法和装置，方法包括：采集声源时域信号；将所述时域信号转换为频域信号；根据所述频域信号确定频率的空间功率谱；根据所述空间功率谱确定频率的空间功率概率。装置包括：采集单元，用于采集声源时域信号；转换单元，用于将所述时域信号转换为频域信号；功率确定单元，用于根据所述频域信号确定频率的空间功率谱；概率确定单元，用于根据所述空间功率谱确定频率的空间功率概率分布；定位单元，用于根据空间概率分布确定概率最大的空间位置。本发明专利技术运用空间功率概率分布确定声源，可以提高声源阵列在噪声、混响等环境下的定位准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及多媒体通信领域的音频处理技术，特别涉及一种声源定位方法。
技术介绍
声源定位技术指的是估计除声源所在的位置。声源定位技术有着广泛的应用，例如在视频会议系统中，可采样声源定位技术估计出说话人所在的位置，然后控制摄像机镜头指向说话人所在的位置，实行声控切换功能。声源定位技术也可以应用到监控、语音增强等领域。下面对现有的SRP(steered response power)以及SRP-PHAT(phasetrans form)声源定位技术进行介绍。如图3所示，lps对应声源，l1和l2对应两个麦克风，如麦克风。从声源lps到两个麦克风l1和l2的时延分别用TOF(lps，l1)和TOF(lps，l1)表示。两个麦克风之间收到的信号分别为x1(t)和x2(t)，则x1(t+TOF(lps，l1))∝x2(t+TOF(lps，l2))，其中 fs是采样频率，c是声速。同时，对应的两个麦克风信号之间的时延τ有如下的定义，当τ＝TOF(lps，l1)-TOF(lps，l2)时，x1(t)和x2(t)的时域互相关函数g(x1，x2)具有最大值，g(x1，x2)＝∫Rx1(t)·x2(t+τ)dε。对于任一麦克风对q，它们的位置对应(laq，lbq)，声源lps到达麦克风对q的理论到达时延差(TDOA，Time-difference of arrival)为 SRP方法通过估计空间上的功率谱分布，找出功率最大的空间位置，该位置即为声源的位置。SRP最基本的公式如下其中，在l位置的声源被各个麦克风拾取后，在时...

【技术保护点】
一种声源定位方法，其特征在于，该方法包括：采集声源时域信号；将所述时域信号转换为频域信号；根据所述频域信号确定频率的空间功率谱；根据所述空间功率谱确定频率的空间功率概率分布；根据空间概率分布确定概率最大的空间位置，以概率最大的空间位置作为声源位置。

【技术特征摘要】

【专利技术属性】
技术研发人员：詹五洲，王东琦，
申请(专利权)人：华为终端有限公司，
类型：发明
国别省市：94[中国|深圳]

全部详细技术资料下载我是这个专利的主人