基于双向双耳匹配滤波器加权融合的双耳声源定位方法技术

技术编号:16174822 阅读:32 留言:0更新日期:2017-09-09 02:09
本发明专利技术提出了一种基于双向双耳匹配滤波器加权融合的双耳声源定位方法,提出了一种新的双耳定位线索,采用双向匹配,决策加权融合的方法得到鲁棒的特征双耳线索。利用包含更多能量信息的定位线索进行定位,有效解决了声源定位技术中双耳线索在噪声环境下只能在部分区域性能最优、垂直方向定位效果差的问题。该方法提出了双耳匹配滤波的概念,提取新的定位线索,降低了算法的时间复杂度,保证了声源定位系统的实时性要求。通过该方法,可以提高在噪声环境下的双耳声源定位的效果。

【技术实现步骤摘要】
基于双向双耳匹配滤波器加权融合的双耳声源定位方法
本专利技术属于信息
,涉及一种适用于复杂声学环境下的双耳声源定位方法,具体涉及一种基于双向双耳匹配滤波器加权融合的双耳声源定位方法。
技术介绍
声源定位技术是指对接收到的信号进行处理得到自然声源或人为声源所在的位置信息。它涉及到人工智能、听觉心理学、听觉生理学和高性能计算机系统等多个研究领域,在多种领域有广泛的应用前景。由于声音具有绕过障碍物的特性,在机器人多信息采集系统中,听觉可以与机器人视觉相配合弥补其视觉有限性及不能穿过非透光障碍物的局限性。早期的机器人导航主要使用测距传感器(如声纳),而跟踪主要依靠视觉。这种形式在视觉场景内被广泛作为定位目标的方式。但是像人和大部分动物那样,视觉场景被限制在小于180°的范围内。在真实世界中,听觉能带来360°的“听觉场景”。它能定位不在视觉场景内的声音目标,即定位由物体遮挡造成的模糊目标或在拐角处的声音目标。双耳声源定位是声源定位技术发展的一个重要分支。双耳定位充分利用了双麦克风的易搭载性和耳廓的滤波特性,在智能监控、移动机器人、虚拟现实、视频会议等研究中有着重要的应用。它是声源定位技术的一个重要分支,不仅利用了双麦克风简易的阵列结构,又结合人耳听觉特性成功克服了双麦克风定位的前后向歧义性。双耳音频天然具有很多通信及多媒体体验的优势。在人与人的日常交互中,听觉感知都是人与人之间最有效最直接的交互方式之一。其中在日常感知世界、获取信息的主要过程中,人们通过视觉获取的信息大约占到了70%-80%,通过听觉获取的信息大约占到了10%-20%。因此在机器人智能化程度不断提升的过程中,机器人的听觉交互是必不可少的研究方向。人和其他的哺乳动物的听觉系统都具有很强的声源定位能力,因此人类一直期望机器人能够像人一样具有实时定位环境中的声源位置的能力。事实上,能否进行听觉定位是机器人智能与否的重要标志之一。与机器人视觉相比,机器人听觉仍然处于初始阶段。然而与机器人视觉相比,听觉的优势在于:1)视觉的应用场景仅限于180°范围内,而听觉却可以定位到360°的范围。2)由于声音信号的衍射性能,相较于视觉、激光等其他的传感信号听觉不需要直线视野,在有视野遮蔽障碍物的情况下依然可以有效的工作。基本上,双耳声音源定位是一个模式分类的问题。类似于自动语音识别,其主要的两大步骤分别是:语音信号处理和模式分类。首先通过双耳传声器接收原始的声音源信号,并进行模数转换,把模拟声音信号转换成数字信号。在信号处理阶段,首先对原始信号进行预处理:降噪和滤波,信号预加重,分帧并加窗,对于每帧信号提取特征时域的特征或频域特征组成特征向量。特征向量可以有效表征声源的位置信息。模式分类阶段,通过与定位系统中的先验知识(即模板)进行比对从而得出定位结果。现有的声源定位系统包括以下步骤:1、语音录入,预滤波、模数变换。先把录入的模拟声音信号进行预滤波,高通滤波抑制50Hz电源噪声信号;低通滤波滤除声音信号中频率分量超过采样频率一半的部分,防止混叠干扰,对模拟声音信号进行采样和量化得到数字信号。2、预加重。信号通过高频加重滤波器冲激响应H(z)=1-0.95z-1,以补偿嘴唇辐射带来的高频衰减。3、分帧、加窗。由于语音信号的慢时变性,整体非平稳,局部平稳,一般认为语音信号在10-30ms内是平稳的,可以把声音信号按照20ms的长度进行分帧。分帧函数为:xk(n)=w(n)s(Nk+n)n=0,1...N-1;k=0,1...L-1其中N为帧长,L为帧数,s表示语音信号。w(n)为窗函数,它的选择(形状和长度)对短时分析参数的特性影响很大,常用的窗函数包括矩形窗、汉宁窗和汉明窗等。一般选用汉明窗,可以很好地反应语音信号的特性变化,汉明窗表达式为:4、特征提取。利用信号匹配滤波的思想。将双耳信号中的其中一个作为输入信号,另一个作为期望输出信号,通过求解匹配的滤波器系数,将其视为一种新的特征线索。5、在线定位。从双耳传声器接收的音频信号中提取特征与模板中存储的特征进行全局匹配,差别最小的情况被视为声源最有可能出现的位置。不过在几何定位中则是直接利用双耳特征与环境位置之间的关系计算声源的坐标,这种模式理论上可以得到准确解,但是易受环境噪声及混响等因素的干扰。目前主要的声源定位算法包括麦克风阵列声源定位算法和基于双通道的声源定位算法。基于双通道语音信号的声源定位方法模拟人耳的听觉特征,可以实现较为准确的声源定位。最具有代表性的是基于互相关函数的双耳时间差估计,然而实际环境下的噪声和混响,会严重影响基于互相关函数的声源定位性能。传统的双耳声源定位方法主要提取双耳时间差和双耳能量差作为定位线索。由于时间差和能量差的提取与声源的频率有关,而且转向角的确定只与时间差及部分高频能量差相关,俯仰角的确定只与能量差有关。所以传统的定位线索在一定程度上并不能满足精准定位的需求,仍有许多问题亟待解决。
技术实现思路
本专利技术提出了一种基于双向双耳匹配滤波器加权融合的双耳声源定位方法,提出了一种新的双耳定位线索,采用双向匹配,决策加权融合的方法得到鲁棒的特征双耳线索。利用包含更多能量信息的定位线索进行定位,有效解决了声源定位技术中双耳线索在噪声环境下只能在部分区域性能最优、垂直方向定位效果差的问题。该方法提出了双耳匹配滤波的概念,提取新的定位线索,降低了算法的时间复杂度,保证了声源定位系统的实时性要求。通过该方法,可以提高在噪声环境下的双耳声源定位的效果。为了实现上述目的,本专利技术采用以下技术方案:一种基于双向双耳匹配滤波器加权融合的双耳声源定位方法,主要以下步骤:1)训练阶段,在定位空间录制声源数据,保存于双耳语音声源定位数据库,为决策加权融合后的数据库中声源数据的双向双耳匹配滤波器建立模板,具体包括:1-1)定位空间按照转向角(水平方向)和俯仰角(竖直方向)划分坐标系;1-2)采用固定声源到坐标系中心距离,在室内/半室内安静环境中分别为定位空间划分后的每个方向录制声源数据;1-3)决策加权融合,分别计算每个方向上声源数据的双向双耳匹配滤波器的代价函数和误差函数,根据得到的代价函数和误差函数对双向双耳匹配滤波器进行加权融合;1-4)离线训练,为每个方向的加权融合后的双向双耳匹配滤波器的系数向量建立模板;2)定位线索提取阶段,当检测到声源时,计算得到的声源数据的双向双耳匹配滤波器的代价函数和误差函数进行加权融合,得到融合后的混合双向双耳匹配滤波器系数向量,作为提取的定位线索;3)将步骤2)中得到定位线索与步骤1)中训练的模板进行相似性计算;然后通过概率计算,实现双耳声源定位。进一步地,步骤1)转向角(水平方向)采用非均匀的划分方法,俯仰角(竖直方向)采用均匀划分的方式。进一步地,步骤1)所述模板包括所有方向上混合双向双耳匹配滤波器系数加权融合后得到的系数向量。进一步地,步骤1-3),分别跟据以下公式计算每个方向上的双向双耳匹配滤波器的误差函数和代价函数:ef(n)=xr(n)-yf(n),eb(n)=xl(n)-yb(n);其中xr(n),xl(n)分别表示左耳和右耳接收的语音信号,yf(n),yb(n)分别表示正向双耳匹配滤波器的期望输出信号和逆向双耳匹配滤波器的期望输出信号;E表示最本文档来自技高网
...
基于双向双耳匹配滤波器加权融合的双耳声源定位方法

【技术保护点】
一种基于双向双耳匹配滤波器加权融合的双耳声源定位方法,包括以下步骤:1)训练阶段,在定位空间录制声源数据,保存于双耳语音声源定位数据库,为决策加权融合后的数据库中声源数据的双向双耳匹配滤波器建立模板;2)定位线索提取阶段,当检测到声源时,计算得到的声源数据的双向双耳匹配滤波器的代价函数和误差函数进行加权融合,得到融合后的混合双向双耳匹配滤波器系数向量,作为提取的定位线索;3)将步骤2)中得到定位线索与步骤1)中训练的模板进行相似性计算;然后通过概率计算,实现双耳声源定位。

【技术特征摘要】
1.一种基于双向双耳匹配滤波器加权融合的双耳声源定位方法,包括以下步骤:1)训练阶段,在定位空间录制声源数据,保存于双耳语音声源定位数据库,为决策加权融合后的数据库中声源数据的双向双耳匹配滤波器建立模板;2)定位线索提取阶段,当检测到声源时,计算得到的声源数据的双向双耳匹配滤波器的代价函数和误差函数进行加权融合,得到融合后的混合双向双耳匹配滤波器系数向量,作为提取的定位线索;3)将步骤2)中得到定位线索与步骤1)中训练的模板进行相似性计算;然后通过概率计算,实现双耳声源定位。2.如权利要求1所述的基于双向双耳匹配滤波器加权融合的双耳声源定位方法,其特征在于,步骤1)所述模板包括所有方向上混合双向双耳匹配滤波器系数加权融合后得到的系数向量。3.如权利要求1所述的基于双向双耳匹配滤波器加权融合的双耳声源定位方法,其特征在于,步骤1)包括以下分步骤:1-1)定位空间按照转向角和俯仰角划分坐标系;1-2)采用固定声源到坐标系中心距离,在室内/半室内安静环境中分别为定位空间划分后的每个方向录制声源数据;1-3)决策加权融合,分别计算每个方向上声源数据的双向双耳匹配滤波器的代价函数和误差函数,根据得到的代价函数和误差函数对双向双耳匹配滤波器进行加权融合;1-4)离线训练,为每个方向的加权融合后的双向双耳匹配滤波器的系数向量建立模板。4.如权利要求3所述的基于双向双耳匹配滤波器加权融合的双耳声源定位方法,其特征在于,步骤1-1)转向角采用非均匀的划分方法,俯仰角采用均匀划分的方式。5.如权利要求3所述的基于双向双耳匹配滤波器加权融合的双耳声源定位方法,其特征在于,步骤1-3),分别跟据以下公式计算每个方向上的双向双耳匹配滤波器的误差函数和代价函数:ef(n)=xr(n)-yf(n),eb(n)=xl(n)-yb(n);其中xr(n),xl(n)分别表示左耳和右耳接收的语音信号,yf(n),yb(n)分别表示正向双耳匹配滤波器的期望输出信号和逆向双耳匹配滤波器的期望输出信号;E表示最小均方误差。6.如权利要求3所述的基于双向双耳匹配滤波器加权融合的双耳声源定位方法,其特征在于,步骤1-3)所述双向双耳匹配滤波器的系数向量通过最...

【专利技术属性】
技术研发人员:刘宏岳梦荻
申请(专利权)人:北京大学深圳研究生院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1