【技术实现步骤摘要】
一种基于加权模板匹配的双耳声源定位方法和装置
本专利技术属于信息
,涉及一种应用在语音感知和语音增强中的双耳声源定位方法,具体涉及一种基于加权模板匹配的双耳声源定位方法和装置。技术背景人机交互在机器人领域具有越来越重要的作用,人机交互能够使人与机器的交流更加方便、高效、友好。在日常生活中,人们感知外界信息的主要方式有视觉、听觉、触觉、嗅觉、味觉等。其中人类通过视觉获得的信息约占70%-80%,通过听觉获得的信息约占10%-20%。听觉感知是人们与外界进行信息交流最自然、方便,有效的方式之一。另外相比于视觉信号,听觉信号具有360度的视野,不受光照影响,也不需要满足声源和麦克风之间无遮挡物等条件,因此,机器人听觉是实现人机交互的重要途径之一。机器人听觉主要包括声源的定位与追踪、语音去噪、语音增强、语音分离、说话人识别、语音识别、语音情感识别等,其中声源定位作为机器人听觉前端的一个任务,可以为其它语音任务提供语音空间位置信息作为辅助。机器人声源定位已成为机器人听觉系统的一个重要组成部分。语音分离来自于著名的‘鸡 ...
【技术保护点】
1.一种基于加权模板匹配的双耳声源定位方法,其特征在于,包括以下步骤:/n从训练数据中提取不同方向的双耳互相关函数和双耳强度差;/n为提取的各个方向的双耳互相关函数和双耳强度差建立模板;/n训练不同双耳定位特征和不同频带的权重;/n在线定位时,提取声源信号的双耳互相关函数和双耳强度差,将其与各个方向的模板进行相似度匹配,并通过训练得到的权重融合不同特征不同频带的相似度,实现声源定位。/n
【技术特征摘要】
1.一种基于加权模板匹配的双耳声源定位方法,其特征在于,包括以下步骤:
从训练数据中提取不同方向的双耳互相关函数和双耳强度差;
为提取的各个方向的双耳互相关函数和双耳强度差建立模板;
训练不同双耳定位特征和不同频带的权重;
在线定位时,提取声源信号的双耳互相关函数和双耳强度差,将其与各个方向的模板进行相似度匹配,并通过训练得到的权重融合不同特征不同频带的相似度,实现声源定位。
2.根据权利要求1所述的方法,其特征在于,所述从训练数据中提取不同方向的双耳定位特征,是采用双耳冲激函数与纯净语音信号卷积或者直接利用录入的声音信号,计算出所有方向上的互相关函数和双耳强度差;其中不同方向是指分成不同的水平转向角,转向角采用非均匀的划分方式。
3.根据权利要求1所述的方法,其特征在于,所述转向角的划分方式为:
[-80°,-65°,-55°,-45°:5°:45°,55°,65°,80°]。
4.根据权利要求1所述的方法,其特征在于,所述为提取的各个方向的双耳互相关函数和双耳强度差建立模板,是将多帧从同一方向发出的无噪声语音帧中提取的双耳定位特征平均值作为该方向的模板。
5.根据权利要求1所述的方法,其特征在于,所述训练不同的双耳定位特征和不同频带的权重,是采用反向传播方法进行训练,损失函数设置为平方损失,使得同方向的模板之间的相似度最大,不同方向的模板间相似度尽可能小。
6.根据权利要求1所述的方法,其特征在于,采用以下公式计算所述相似度:
其中,sim(θ)表示加权后的相似度矩阵,ωccf,i表示在第i个频带上互相关函数的权重,simccf,i(θ)表示在第i个频带...
【专利技术属性】
技术研发人员:丁润伟,孙永恒,杨冰,刘宏,
申请(专利权)人:深港产学研基地北京大学香港科技大学深圳研修院,北京大学深圳研究生院,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。