声源定位方法、装置、可读存储介质及电子设备制造方法及图纸

技术编号：24173685 阅读：88 留言：0更新日期：2020-05-16 03:50

本公开涉及一种声源定位方法、装置、可读存储介质及电子设备。该方法包括：从N个麦克风中获取目标音频信号，其中，每一所述麦克风设置在不同位置，N为大于等于3的整数；从N条所述目标音频信号中提取多维度音频特征；根据所述多维度音频特征和预先训练的声源定位模型，确定所述目标音频的声源位置。如此，基于声源定位模型确定目标音频的声源位置，可以提高确定声源位置的准确度。并且，通过多维度音频特征确定声源位置，相较于现有技术仅通过相位差确定声源位置，进一步提高了所确定的声源位置的准确度，以及鲁棒性。

Sound source location method, device, readable storage medium and electronic equipment

全部详细技术资料下载

【技术实现步骤摘要】
声源定位方法、装置、可读存储介质及电子设备
本公开涉及定位
，具体地，涉及一种声源定位方法、装置、可读存储介质及电子设备。
技术介绍
声源定位是指听觉(声学)系统对发声物体位置的判断过程。通过声源定位可以准确识别出发声物体所在的位置。目前的声源定位多是将多个麦克风按照一定顺序布设在空间的不同位置，并通过对各个麦克风接收的音频信号进行处理，最终根据计算得出声源的最终位置。在传统声源定位方法中，需要先计算至少三条音频信号到达麦克风的相位差(即，音频信号达到不同麦克风之间的时间差)，再算出根据相位差所得的双曲线的交点坐标，即可完成定位。但由于相位差是根据两个麦克风采集到的音频信号的互相关关系所得，不同声源的互相关关系存在一定的差异，导致定位不够准确。
技术实现思路
本公开的目的是提供一种声源定位方法、装置、可读存储介质及电子设备，以提高声源定位的准确性和鲁棒性。为了实现上述目的，本公开第一方面提供一种声源定位方法，包括：从N个麦克风中获取目标音频信号，其中，每一所述麦克风设置在不同...

【技术保护点】
1.一种声源定位方法，其特征在于，包括：/n从N个麦克风中获取目标音频信号，其中，每一所述麦克风设置在不同位置，N为大于等于3的整数；/n从N条所述目标音频信号中提取多维度音频特征；/n根据所述多维度音频特征和预先训练的声源定位模型，确定所述目标音频的声源位置。/n

【技术特征摘要】
1.一种声源定位方法，其特征在于，包括：
从N个麦克风中获取目标音频信号，其中，每一所述麦克风设置在不同位置，N为大于等于3的整数；
从N条所述目标音频信号中提取多维度音频特征；
根据所述多维度音频特征和预先训练的声源定位模型，确定所述目标音频的声源位置。

2.根据权利要求1所述的方法，其特征在于，所述根据所述多维度音频特征和预先训练的声源定位模型，确定所述目标音频的声源位置，包括：
将所述多维度音频特征输入至预先训练的声源定位模型，以得到针对各位置的第一位置概率，其中，所述位置的数量大于等于2，所述第一位置概率用于表征其对应的位置为所述目标音频的声源位置的概率；
在多个所述第一位置概率中，将最大第一位置概率对应的位置确定为所述目标音频的声源位置。

3.根据权利要求2所述的方法，其特征在于，所述从N条所述目标音频信号中提取多维度音频特征，包括：
针对各条目标音频信号，将该条目标音频信号划分为M帧音频信号；
从N个M帧音频信号中，提取多维度音频特征。

4.根据权利要求3所述的方法，其特征在于，所述从N个M帧音频信号中，提取多维度音频特征，包括：
在每条目标音频信号中，确定各帧音频信号的能量值；
针对同一帧音频信号，均执行以下步骤：
在每两条目标音频信号中确定该帧音频信号的相位差，以及，根据每两条目标音频信号中的该帧音频信号的能量值，确定该两条目标音频信号中的该帧音频信号的能量差；
根据该帧音频信号的所述相位差、所述能量值以及所述能量差，确定该帧音频信号的音频特征。

5.根据权利要求4所述的方法，其特征在于，所述将所述多维度音频特征输入至预先训练的声源定位模型，以得到针对各位置的第一位置概率，包括：
针对同一帧音频信号，将该帧音频信号的多维度音频特征输入至预先训练的...

【专利技术属性】
技术研发人员：莫凡，孙珏，刘士杰，
申请(专利权)人：镁佳北京科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人