一种基于双耳匹配滤波器的双耳声音源定位方法技术

技术编号：10188533 阅读：214 留言：0更新日期：2014-07-04 20:57

本发明专利技术公开了一种新的基于贝叶斯分层模式的双耳声音源定位方法，首先，可靠频带选择机制保证了选择用于估计双耳时间差的频带是可靠的，提高了时间差的估计精度；其次，利用双耳能量差来缩小第一层得到的候选方向集合；再次，第三层提出了双耳匹配滤波器作为新的双耳定位特征，它描述了双耳信号之间的差异，能够充分表达双耳时间差和双耳能量差之间的关系；最后，针对三层定位过程中搜索空间逐渐缩小，采用贝叶斯决策的准则得到概率最大的方向。这种分层的定位系统能够有效地减少特征匹配的次数，降低了算法的时间复杂度，保证了声源定位系统的实时性要求。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种新的基于贝叶斯分层模式的双耳声音源定位方法，首先，可靠频带选择机制保证了选择用于估计双耳时间差的频带是可靠的，提高了时间差的估计精度；其次，利用双耳能量差来缩小第一层得到的候选方向集合；再次，第三层提出了双耳匹配滤波器作为新的双耳定位特征，它描述了双耳信号之间的差异，能够充分表达双耳时间差和双耳能量差之间的关系；最后，针对三层定位过程中搜索空间逐渐缩小，采用贝叶斯决策的准则得到概率最大的方向。这种分层的定位系统能够有效地减少特征匹配的次数，降低了算法的时间复杂度，保证了声源定位系统的实时性要求。【专利说明】
本专利技术属于信息
，涉及一种应用在语音感知和语音增强中的双耳声源定位方法，具体涉及。
技术介绍
双耳音频天然具有很多通信及多媒体体验的优势。在人与人的日常交互中，听觉感知都是人与人之间最有效最直接的交互方式之一。其中在日常感知世界、获取信息的主要过程中，人们通过视觉获取的信息大约占到了 70%-80%，通过听觉获取的信息大约占到了10%-20%。因此在机器人智能化程度不断提升的过程中，机器人的听觉交互是必不可少的研究方向。人和其他的哺乳动物的听觉系统都具有很强的声源定位能力，因此人类一直期望机器人能够像人一样具有实时定位环境中的声源位置的能力。事实上，能否进行听觉定位是机器人智能与否的重要标志之一。与机器人视觉相比，机器人听觉仍然处于初始阶段。然而与机器人视觉相比，听觉的优势在于:I)视觉的应用场景仅限于180°范围内，而听觉却可以定位到360°的范围。2)由于声音信号的衍射性能，相较于视觉、激光等其...

【技术保护点】
一种基于双耳匹配滤波器的双耳声音源定位方法，包括：1）训练阶段，录制双耳声音源定位数据库，为双耳时间差、双耳能量差和双儿耳匹配滤波器建立模板，具体包括：1‑1）将定位空间按照转向角和俯仰角划分；1‑2）采用固定声源到坐标系中心距离，在室内/半室内安静环境中分别为定位空间划分后的每个方向录制声音数据；1‑3）离线为每个方向上的双耳时间差、双耳能量差和双耳匹配滤波器建立模板，得到双耳时间差和双耳能量差的期望和方差；2）在线定位阶段，当声源定位系统检测到有声音源发生，利用可靠频带选择机制选择可靠的频带，并计算得到双耳时间差、双耳能量差和双耳匹配滤波器的系数向量；3）将步骤2）中得到的双耳时间差按转向角在模板中搜索匹配的方向作为候选区域，其次在此候选区域中搜索匹配的双耳能量差所对应的转向角和俯仰角，得到缩小的搜索空间，再基于前面得到的搜索空间计算每个方向上双耳匹配滤波器的相似度，最终采用贝叶斯分层的搜索策略得到候选区域里所有方向中概率最大的声音源的转向角和俯仰角，实现双耳声音源定位。

【技术特征摘要】

【专利技术属性】
技术研发人员：刘宏，张结，丁润伟，
申请(专利权)人：北京大学深圳研究生院，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人