一种分布式非同步声传感器的声源空间定位方法技术

技术编号：6679013 阅读：347 留言：0更新日期：2012-04-11 18:40

一种分布式非同步声传感器的声源空间定位方法，先在假设条件下计算空间坐标，再发射校正信号计算分布式非同步声传感器的结构，然后对分布式非同步声传感器采集的信号进行预处理，再对声源信号采用时延估计法计算，得到对应的时延估计值，最后根据时延估计值计算每个声源的空间位置坐标，本发明专利技术声传感器的排列和间距没有任何限制，声传感器采集的信号在时间域不完全同步，具有价格低廉、使用方便等优势，可应用于复杂声学环境下的多人多方对话场景。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于语音
，具体涉及一种分布式非同步声传感器的声源空间定位方法。
技术介绍
随着网络和通讯技术的不断发展，利用现有的多媒体技术、网络与通讯技术、分布式处理技术等可以实现复杂声学环境场景下的多人多方对话。传统声源输入和录音设备包括头戴式麦克风、全向性和方向性麦克风、麦克风阵列等。单麦克风作为传统声源输入和录音设备，具有体积小、价格低廉等优点，但不具备对环境噪声处理以及声源定位的能力；麦克风阵列由多个按照特定几何位置摆放的麦克风组成，对空间信号进行时空域联合处理，其能力包括混响条件下的声源定位、增强语音信号、辨识与分离声源等。分布式非同步声传感器是由多个单声传感器组成的信号采集系统，各个声传感器由不同设备控制，对声传感器的排列和间距没有任何限制，声传感器采集的信号在时间域不完全同步。分布式非同步声传感器结构简单、使用方便、节约成本，符合多声源多方向复杂对活场景的要求，可有效地完成声源定位、说话人聚类和识别等多种应用。但是，麦克风阵列系统算法对各个设备之间采样的误差敏感，因此对音频数据同步性要求十分严格；而普通的多人多方会议场景中声源个数未知、声传感器位置未知、房间声学环境未知，即需要在时间和空间先验信息均缺失的场景下对声音数据进行处理。分布式非同步声传感器的声源空间定位方法和麦克风阵列的声源空间定位方法有所不同。麦克风阵列的麦克风需要组成阵列，或至少麦克风间距固定，而分布式非同步声传感器对声传感器的位置和摆放没有任何约束和限制，因此使用更加灵活；麦克风阵列采集的信号在时间域完全同步，各个麦克风由统一的时钟进行控制，...

【技术保护点】
１．一种分布式非同步声传感器的声源空间定位方法，其特征在于：包括以下步骤：第一步，在假设条件下计算空间坐标首先假设在数据获得过程中全部声传感器的数目ｎ和空间位置不变，ｎ为大于零的整数，声源数目ｋ不变，ｋ为大于零的整数，声源与声传感器距离符合近场模型的要求，各个声传感器的物理性质相同，再对每个声传感器按顺序编号为声传感器Ｍ１，Ｍ２…，Ｍｎ，选择初始编号为１和２的两个声传感器Ｍ１和Ｍ２，设声传感器Ｍ１的位置为原点坐标，声传感器Ｍ１到声传感器Ｍ２的方向为起点坐标轴方向，这样可以确定一个空间坐标系，第二步，发射校正信号计算分布式非同步声传感器的结构首先令声传感器Ｍ１发射校正信号Ｃ，除声传感器Ｍ１之外的其他声传感器进行记录；同样地，声传感器Ｍ２发射相同的校正信号Ｃ，除声传感器Ｍ２之外的其他声传感器进行记录；以此类推，全部ｎ个声传感器都发射一遍校正信号Ｃ；这样，每个声传感器得到对应ｎ－１个记录信号；计算这ｎ－１个记录信号的起始时间与每个声传感器Ｍｉ发射校正信号Ｃ时刻的对应时延，时延与声速ｃ的乘积则为每个发射声传感器Ｍｉ到每个接收声传感器Ｍｊ的物理距离ｄｉｊ。公式（９）所示：Ｅｈ［ｌ，ｋ］＝（１－λ...

【技术特征摘要】

【专利技术属性】
技术研发人员：杨毅，刘加，
申请(专利权)人：清华大学，
类型：发明
国别省市：11

全部详细技术资料下载我是这个专利的主人