一种声源定位方法、装置、电子设备及介质制造方法及图纸

技术编号：40425126 阅读：6 留言：0更新日期：2024-02-20 22:45

本申请实施例公开了一种声源定位方法、装置、电子设备及介质。该方法包括：根据预设时段内接收的声音信号进行声源定位，确定稳定声源角度以及对应的稳定声音信号；逐帧遍历预设时段内的声音信号，确定在目标帧接收的声音信号中所述稳定声源角度对应的参考声音信号，以及能量最大的最大声音信号；根据所述稳定声音信号、所述参考声音信号以及所述最大声音信号，确定目标帧对应的实际声源角度。上述方案能够通过稳定声音信号、参考声音信号以及最大声音信号的特征，准确地分析最大声音信号是否为反射峰，如果为反射峰，则在声源定位时不参考反射峰的声音信号，避免对声源定位产生影响，从而提高了声源定位的准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机，尤其涉及一种声源定位方法、装置、电子设备及介质。

技术介绍

1、在音频算法处理中，声源定位算法在许多应用场景都发挥着很大的作用，声源定位的准确度是声源定位算法中最关注的问题。在声源定位时，将声音的能量值进行量化，通常认定能量值最大的方向为声源的方向。

2、声源在发声的过程中，由于周围物体或是声源处于特定场所的影响，声源发出的声波会被反射(通常称之为回音)，被反射的声波的能量值通常是小于正常说话的声音的能量值的，目前对于一般的声波的反射可以进行消除。而当反射的声波的能量值大于正常声源发出的声波的能量值，即反射峰出现时，现有技术通常会认为反射峰的方向为声源方向，导致声源定位不准确。

技术实现思路

1、本申请实施例提供了一种声源定位方法、装置、电子设备及介质，以消除反射峰对声源定位的影响，提高声源定位的准确性。

2、根据本申请的一方面，提供了一种声源定位方法，该方法包括：

3、根据预设时段内接收的声音信号进行声源定位，确定稳定声源角度以及对应的稳定声音信号；

4、逐帧遍历预设时段内的声音信号，确定在目标帧接收的声音信号中所述稳定声源角度对应的参考声音信号，以及能量最大的最大声音信号；

5、根据所述稳定声音信号、所述参考声音信号以及所述最大声音信号，确定目标帧对应的实际声源角度。

6、根据本申请的一方面，提供了一种声源定位装置，所述装置包括：

7、稳定声源角度确定模块，用于根据预设时段内接

8、遍历模块，用于逐帧遍历预设时段内的声音信号，确定在目标帧接收的声音信号中所述稳定声源角度对应的参考声音信号，以及能量最大的最大声音信号；

9、实际声源角度确定模块，用于根据所述稳定声音信号、所述参考声音信号以及所述最大声音信号，确定目标帧对应的实际声源角度。

10、根据本申请的另一方面，提供了一种电子设备，该电子设备包括：

11、至少一个处理器；以及

12、与至少一个处理器通信连接的存储器；其中，

13、存储器存储有可被至少一个处理器执行的计算机程序，计算机程序被至少一个处理器执行，以使至少一个处理器能够执行本申请任一实施例的声源定位方法。

14、根据本申请的另一方面，提供了一种计算机可读存储介质，计算机可读存储介质存储有计算机指令，计算机指令用于使处理器执行时实现本申请任一实施例的声源定位方法。

15、本申请实施例的技术方案，根据预设时段内接收的声音信号进行声源定位，确定稳定声源角度以及对应的稳定声音信号；逐帧遍历预设时段内的声音信号，确定在目标帧接收的声音信号中所述稳定声源角度对应的参考声音信号，以及能量最大的最大声音信号；根据所述稳定声音信号、所述参考声音信号以及所述最大声音信号，确定目标帧对应的实际声源角度。上述方案能够通过稳定声音角度对应的稳定声音信号、最大声音信号以及参考声音信号的特征，准确地判断能量最大的最大声音信号是否为反射峰，在最大声音信号为反射峰的情况下，不再依据最大声音信号进行声源定位，消除了反射峰对声源定位的影响，避免反射峰的信号强度最大时将反射峰的角度误判为声源角度，从而提高了声源定位的准确性。

16、应当理解，本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征，也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。

本文档来自技高网...

【技术保护点】

1.一种声源定位方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，根据预设时段内接收的声音信号进行声源定位，确定稳定声源角度以及对应的稳定声音信号，包括：

3.根据权利要求1所述的方法，其特征在于，逐帧遍历预设时段内的声音信号，确定在目标帧接收的声音信号中所述稳定声源角度对应的参考声音信号，以及能量最大的最大声音信号，包括：

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于，根据所述稳定声音信号、所述参考声音信号以及所述最大声音信号，确定目标帧对应的实际声源角度，包括：

6.根据权利要求5所述的方法，其特征在于，根据所述第一相关系数与所述第二相关系数，确定目标帧对应的实际声源角度，包括：

7.根据权利要求1-6中任一项所述的方法，其特征在于，所述目标帧包括预设数量个声音采集时刻；所述第一相关系数的确定过程包括：

8.一种声源定位装置，其特征在于，所述装置包括：

9.一种电子设备，其特征在于，所述电子设备包括：

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的声源定位方法。

...

【技术特征摘要】

1.一种声源定位方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，根据预设时段内接收的声音信号进行声源定位，确定稳定声源角度以及对应的稳定声音信号，包括：

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于，根据所述稳定声音信号、所述参考声音信号以及所述最大声音信号，确定目标帧对应的实际...

【专利技术属性】
技术研发人员：李御臣，
申请(专利权)人：浙江宇视科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人