一种基于融合置信度的声源定位方法和系统技术方案

技术编号:45898522 阅读:8 留言:0更新日期:2025-07-22 21:25
本发明专利技术声源定位技术领域,提供一种基于融合置信度的声源定位方法和系统。该方法包括:当检测到预设唤醒词时,启动声源定位处理,根据所检测的当前语音信号,计算水平方位角,确定声源定位区域;计算相匹配的已有用户声纹,确认当前语音信号所对应的当前用户;计算与当前语音信号相对应的用户偏好融合系数,计算当前语音信号的融合置信度,以动态调整云台摄像头的扫描范围,以在扫描过程中以固定间隔捕获当前用户的图像帧,执行人脸检测,得到待处理人脸图像,进行面部特征提取,进行视觉身份协同确认,在满足身份一致性条件时,停止云台摄像头的转动,锁定当前方位为声源定位位置。本发明专利技术在降低硬件复杂度的同时有效提升了定位精度。

【技术实现步骤摘要】

本专利技术属于声源定位,提供一种基于融合置信度的声源定位方法和系统


技术介绍

1、声源定位(sound source localization,ssl)是通过分析声波传播特性,利用多麦克风阵列采集信号并计算时间差、相位差等信息,确定声源空间位置的技术。其核心目标是通过数学建模和信号处理还原声源的方向(方位角、俯仰角)或距离参数。基于声波到达不同麦克风的时间差、声级差或相位差,结合几何关系构建方程求解声源位置。例如,三角形麦克风阵列可通过互相关算法计算时间延迟,反推声源方向。

2、现有技术中存在以下问题:空间维度缺陷,双麦克风系统受限于几何约束,只能做平面定位,无法解析声源仰角和前后方位;模态单一缺陷:纯声学方法在snr小于10db时定位误差加大,例如可达6cm~8 cm;场景适应性缺陷,缺乏多模态数据验证机制,无法解决声源移动、多人同时发声等场景的定位冲突。

3、因此,有必要提供一种新的基于融合置信度的声源定位方法和系统,以解决上述问题。


技术实现思路

1、本专利技术提供一种基于融合本文档来自技高网...

【技术保护点】

1.一种基于融合置信度的声源定位方法,其特征在于,包括:

2.根据权利要求1所述的声源定位方法,其特征在于,所述根据计算与所述当前语音信号相匹配的已有用户声纹所得到的匹配度,进一步计算所述当前语音信号的融合置信度,包括:

3.根据权利要求2所述的声源定位方法,其特征在于,进一步包括:

4.根据权利要求2所述的声源定位方法,其特征在于,进一步包括:

5.根据权利要求2所述的声源定位方法,其特征在于,进一步包括:

6.根据权利要求5所述的声源定位方法,其特征在于,进一步包括:

7.根据权利要求1所述的声源定位方法,其特征...

【技术特征摘要】

1.一种基于融合置信度的声源定位方法,其特征在于,包括:

2.根据权利要求1所述的声源定位方法,其特征在于,所述根据计算与所述当前语音信号相匹配的已有用户声纹所得到的匹配度,进一步计算所述当前语音信号的融合置信度,包括:

3.根据权利要求2所述的声源定位方法,其特征在于,进一步包括:

4.根据权利要求2所述的声源定位方法,其特征在于,进一步包括:

5.根据权利要求2所述的声源定位方法,其特征在于,进一步包括:

6.根据权...

【专利技术属性】
技术研发人员:冉梦佳王静怡李虎明王姣姣王希芝杨紫璇
申请(专利权)人:联通在线信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1