声源定位、控制方法、装置、设备及存储介质制造方法及图纸

技术编号：38996193 阅读：11 留言：0更新日期：2023-10-07 10:27

本公开涉及一种声源定位、控制方法、装置、设备及存储介质。本公开通过智能设备采集的多路音频信号检测唤醒事件，并在唤醒事件发生时，根据多路音频信号的协方差矩阵和干扰信号的协方差矩阵，确定用于控制智能设备的声源信号的协方差矩阵。进一步，根据声源信号的协方差矩阵、以及分布在智能设备预设范围内的多个定位点分别对应的导向向量，确定多个定位点分别对应的指向响应，并将多个定位点中指向响应最大的定位点作为声源的定位点。由于唤醒事件的发生意味着智能设备可以从多路音频信号中检测出声源信号，因此，在检测到唤醒事件发生时进行声源定位，可有效避免或降低干扰信号对声源定位的影响，提高了声源定位的精准度。提高了声源定位的精准度。提高了声源定位的精准度。

全部详细技术资料下载

【技术实现步骤摘要】
声源定位、控制方法、装置、设备及存储介质

[0001]本公开涉及信息
，尤其涉及一种声源定位、控制方法、装置、设备及存储介质。

技术介绍

[0002]目前，对于一些智能设备而言，例如智能音箱，可以通过一定的算法对控制该智能音箱的声源进行定位。例如，确定声源相对于智能音箱的距离、方位角、仰角等。
[0003]但是，由于智能设备周围总会出现一些干扰信号，例如，电风扇、电视机等家用电器发出的噪声，或者是用户之间的谈话声等。从而导致智能设备无法精准定位声源。

技术实现思路

[0004]为了解决上述技术问题或者至少部分地解决上述技术问题，本公开提供了一种声源定位、控制方法、装置、设备及存储介质，以精准的对声源进行定位。
[0005]第一方面，本公开实施例提供一种声源定位方法，包括：
[0006]获取智能设备采集的多路音频信号；
[0007]根据所述多路音频信号检测到唤醒所述智能设备的事件发生；
[0008]根据所述多路音频信号的协方差矩阵、以及根据所述多路音频信号得到的干扰信号的协方差矩阵，确定用于控制所述智能设备的声源信号的协方差矩阵；
[0009]根据所述声源信号的协方差矩阵、以及分布在所述智能设备预设范围内的多个定位点分别对应的导向向量，确定所述多个定位点分别对应的指向响应，并将所述多个定位点中指向响应最大的定位点作为声源的定位点。
[0010]第二方面，本公开实施例提供一种智能设备的控制方法，所述方法包括：
[0011]获取智能设备采

【技术保护点】

【技术特征摘要】
1.一种声源定位方法，其中，所述方法包括：获取智能设备采集的多路音频信号；根据所述多路音频信号检测到唤醒所述智能设备的事件发生；根据所述多路音频信号的协方差矩阵、以及根据所述多路音频信号得到的干扰信号的协方差矩阵，确定用于控制所述智能设备的声源信号的协方差矩阵；根据所述声源信号的协方差矩阵、以及分布在所述智能设备预设范围内的多个定位点分别对应的导向向量，确定所述多个定位点分别对应的指向响应，并将所述多个定位点中指向响应最大的定位点作为声源的定位点。2.根据权利要求1所述的方法，其中，根据所述多路音频信号检测到唤醒所述智能设备的事件发生，包括：根据所述多路音频信号，检测唤醒关键词的存在概率；如果所述存在概率满足预设条件，确定唤醒所述智能设备的事件发生。3.根据权利要求2所述的方法，其中，根据所述多路音频信号，检测唤醒关键词的存在概率，包括：对所述多路音频信号分别进行回声消除，得到多路第一时频域信号；根据所述多路第一时频域信号，检测所述唤醒关键词的存在概率。4.根据权利要求3所述的方法，其中，对所述多路音频信号分别进行回声消除，得到多路第一时频域信号，包括：对所述多路音频信号分别进行傅里叶变换，得到所述多路音频信号分别对应的第二时频域信号；对所述多路音频信号分别对应的第二时频域信号进行回声消除，得到所述多路第一时频域信号。5.根据权利要求4所述的方法，其中，所述多路音频信号的协方差矩阵是根据所述多路第一时频域信号确定的。6.根据权利要求4所述的方法，其中，所述干扰信号的协方差矩阵是根据预设概率、以及所述多路第一时频域信号确定的，所述预设概率与所述存在概率相关。7.根据权利要求6所述的方法，其中，若所述存在概率大于预设值，则所述预设概率为0；若所述存在概率小于或等于预设值，则所述预设概率为1。8.一种智能设备的控制方法，其特征在于，所述方法包括：获取智能设备采集的多路音频信号；根据所述多路音频信号检测到唤醒所述智能设备的事件发生；根据所述多路音频信号的协方差矩阵、以及根据所述多路音频信号得到的干扰信号的协方差矩阵，确定用于控制所述智能设备的...

【专利技术属性】
技术研发人员：王子腾，纳跃跃，田彪，付强，
申请(专利权)人：阿里巴巴达摩院杭州科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人