声源定位方法、装置及设备制造方法及图纸

技术编号：30706987 阅读：31 留言：0更新日期：2021-11-06 09:54

本申请公开了会议发言展示系统，声源定位方法和装置，会议系统，拾音设备。其中，所述方法包括：通过指向性麦克风阵列采集多通道语音信号；根据阵列形状信息和麦克风指向方向信息，确定包括相位信息和振幅信息的导向矢量；根据所述导向矢量和所述语音信号，确定声源方向信息。采用这种处理方式，使得在确定导向矢量时同时考虑相位信息和振幅信息，这样可以有效提升声源定位的准确度。效提升声源定位的准确度。效提升声源定位的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
声源定位方法、装置及设备

[0001]本申请涉及语音处理
，具体涉及会议发言展示系统，声源定位方法和装置，会议系统，拾音设备。

技术介绍

[0002]会议场景中的音视频设备的基本功能包括发言者跟踪功能。要实现发言者跟踪功能，就需要对发言者进行实时定位。声源定位（Sound Localization）是对声源空间位置的判定，声源定位的准确度直接影响着发言者跟踪的准确度。
[0003]一种典型的声源定位方法是基于麦克风的波达方向估计（DirectionofArrival，DOA）方法。基于麦克风的DOA方法包括两类：基于全向性麦克风的DOA方法和基于指向性麦克风阵列的DOA方法。由于基于全向性麦克风阵列的DOA方法受混响影响大,而基于指向性麦克风阵列的DOA方法的鲁棒性更高，因此基于指向性麦克风阵列的DOA方法得到了广泛应用。基于指向性麦克风阵列的DOA现有方法是，采用呈圆形的指向性麦克风阵列，在可控响应功率(Steered
‑
Response Power,SRP)声源定位算法基础上增加权重函数（Weighting Function）,利用部分面向声源的麦克风拾取的信号估计声源方向。
[0004]然而，在实现本专利技术过程中，专利技术人发现基于指向性麦克风阵列的DOA现有方案至少存在如下问题：由于只利用了部分面向声源的麦克风拾取的信号，且没有充分利用振幅信息，因此声源定位准确度较低。

技术实现思路

[0005]本申请提供声源定位方法，以解决现有技术存在的声源定位准确...

【技术保护点】

【技术特征摘要】
1.一种会议发言展示系统，其特征在于，包括：终端设备，用于通过指向性麦克风阵列采集会议空间的多通道语音信号；根据阵列形状信息和麦克风指向方向信息，确定包括相位信息和振幅信息的导向矢量；根据所述导向矢量和所述语音信号，确定会议发言用户的位置信息；将所述语音信号和所述位置信息发送至服务端；以及，展示服务端回送的不同会议发言用户的会议发言文本；服务端，用于通过语音识别算法，将所述语音信号转换为会议发言文本；根据所述位置信息，确定不同会议发言用户的会议发言文本。2.一种声源定位方法，其特征在于，包括：通过指向性麦克风阵列采集多通道语音信号；根据阵列形状信息和麦克风指向方向信息，确定包括相位信息和振幅信息的导向矢量；根据所述导向矢量和所述语音信号，确定声源方向信息。3.根据权利要求2的方法，其特征在于，所述根据阵列形状信息和麦克风指向方向信息，确定包括相位信息和振幅信息的导向矢量，包括：根据阵列形状信息，确定相位差；根据麦克风指向方向信息，确定振幅响应；根据相位差和振幅响应，确定所述导向矢量。4.根据权利要求2的方法，其特征在于，所述阵列包括线性阵列；所述阵列形状信息包括麦克风之间的距离；所述麦...

【专利技术属性】
技术研发人员：陈维广，黄伟隆，冯津伟，
申请(专利权)人：阿里巴巴达摩院杭州科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人