声源定位、控制方法、装置、设备及存储介质制造方法及图纸

技术编号:38996193 阅读:11 留言:0更新日期:2023-10-07 10:27
本公开涉及一种声源定位、控制方法、装置、设备及存储介质。本公开通过智能设备采集的多路音频信号检测唤醒事件,并在唤醒事件发生时,根据多路音频信号的协方差矩阵和干扰信号的协方差矩阵,确定用于控制智能设备的声源信号的协方差矩阵。进一步,根据声源信号的协方差矩阵、以及分布在智能设备预设范围内的多个定位点分别对应的导向向量,确定多个定位点分别对应的指向响应,并将多个定位点中指向响应最大的定位点作为声源的定位点。由于唤醒事件的发生意味着智能设备可以从多路音频信号中检测出声源信号,因此,在检测到唤醒事件发生时进行声源定位,可有效避免或降低干扰信号对声源定位的影响,提高了声源定位的精准度。提高了声源定位的精准度。提高了声源定位的精准度。

【技术实现步骤摘要】
声源定位、控制方法、装置、设备及存储介质


[0001]本公开涉及信息
,尤其涉及一种声源定位、控制方法、装置、设备及存储介质。

技术介绍

[0002]目前,对于一些智能设备而言,例如智能音箱,可以通过一定的算法对控制该智能音箱的声源进行定位。例如,确定声源相对于智能音箱的距离、方位角、仰角等。
[0003]但是,由于智能设备周围总会出现一些干扰信号,例如,电风扇、电视机等家用电器发出的噪声,或者是用户之间的谈话声等。从而导致智能设备无法精准定位声源。

技术实现思路

[0004]为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种声源定位、控制方法、装置、设备及存储介质,以精准的对声源进行定位。
[0005]第一方面,本公开实施例提供一种声源定位方法,包括:
[0006]获取智能设备采集的多路音频信号;
[0007]根据所述多路音频信号检测到唤醒所述智能设备的事件发生;
[0008]根据所述多路音频信号的协方差矩阵、以及根据所述多路音频信号得到的干扰信号的协方差矩阵,确定用于控制所述智能设备的声源信号的协方差矩阵;
[0009]根据所述声源信号的协方差矩阵、以及分布在所述智能设备预设范围内的多个定位点分别对应的导向向量,确定所述多个定位点分别对应的指向响应,并将所述多个定位点中指向响应最大的定位点作为声源的定位点。
[0010]第二方面,本公开实施例提供一种智能设备的控制方法,所述方法包括:
[0011]获取智能设备采集的多路音频信号;
[0012]根据所述多路音频信号检测到唤醒所述智能设备的事件发生;
[0013]根据所述多路音频信号的协方差矩阵、以及根据所述多路音频信号得到的干扰信号的协方差矩阵,确定用于控制所述智能设备的声源信号的协方差矩阵;
[0014]根据所述声源信号的协方差矩阵、以及分布在所述智能设备预设范围内的多个定位点分别对应的导向向量,确定所述多个定位点分别对应的指向响应,并将所述多个定位点中指向响应最大的定位点作为声源的定位点;
[0015]根据所述声源的定位点,控制所述智能设备指示所述声源相对于所述智能设备的方位。
[0016]第三方面,本公开实施例提供一种智能音箱的控制方法,所述方法包括:
[0017]获取智能音箱采集的多路音频信号;
[0018]根据所述多路音频信号检测到唤醒所述智能音箱的事件发生;
[0019]根据所述多路音频信号的协方差矩阵、以及根据所述多路音频信号得到的干扰信号的协方差矩阵,确定用于控制所述智能音箱的声源信号的协方差矩阵;
[0020]根据所述声源信号的协方差矩阵、以及分布在所述智能音箱预设范围内的多个定位点分别对应的导向向量,确定所述多个定位点分别对应的指向响应,并将所述多个定位点中指向响应最大的定位点作为声源的定位点;
[0021]根据所述声源的定位点,确定所述声源相对于所述智能音箱的方位;
[0022]根据所述方位,控制所述智能音箱中与所述方位对应的指示灯亮起。
[0023]第四方面,本公开实施例提供一种声源定位装置,包括:
[0024]获取模块,用于获取智能设备采集的多路音频信号;
[0025]检测模块,用于根据所述多路音频信号检测到唤醒所述智能设备的事件发生;
[0026]第一确定模块,用于根据所述多路音频信号的协方差矩阵、以及根据所述多路音频信号得到的干扰信号的协方差矩阵,确定用于控制所述智能设备的声源信号的协方差矩阵;
[0027]第二确定模块,用于根据所述声源信号的协方差矩阵、以及分布在所述智能设备预设范围内的多个定位点分别对应的导向向量,确定所述多个定位点分别对应的指向响应,并将所述多个定位点中指向响应最大的定位点作为声源的定位点。
[0028]第五方面,本公开实施例提供一种电子设备,包括:
[0029]存储器;
[0030]处理器;以及
[0031]计算机程序;
[0032]其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如第一方面、第二方面、第三方面所述的方法。
[0033]第六方面,本公开实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现第一方面、第二方面、第三方面所述的方法。
[0034]本公开实施例提供的声源定位、控制方法、装置、设备及存储介质,通过智能设备采集的多路音频信号检测唤醒事件,并在唤醒事件发生时,根据多路音频信号的协方差矩阵和干扰信号的协方差矩阵,确定用于控制智能设备的声源信号的协方差矩阵。进一步,根据声源信号的协方差矩阵、以及分布在智能设备预设范围内的多个定位点分别对应的导向向量,确定多个定位点分别对应的指向响应,并将多个定位点中指向响应最大的定位点作为声源的定位点。由于唤醒事件的发生意味着智能设备可以从多路音频信号中检测出声源信号,即干扰信号不足以影响智能设备对声源信号的识别和分析,因此,在检测到唤醒事件发生时进行声源定位,可有效避免或降低干扰信号对声源定位的影响。所以,即使智能设备周围存在干扰信号,本实施例也可以精准的对声源进行定位。
附图说明
[0035]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
[0036]为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0037]图1为本公开实施例提供的坐标系的示意图;
[0038]图2为本公开实施例提供的声源定位方法流程图;
[0039]图3为本公开实施例提供的应用场景的示意图;
[0040]图4为本公开另一实施例提供的应用场景的示意图;
[0041]图5为本公开另一实施例提供的定位点的示意图;
[0042]图6为本公开另一实施例提供的声源定位方法流程图;
[0043]图7为本公开另一实施例提供的应用场景的示意图;
[0044]图8为本公开另一实施例提供的声源定位方法流程图;
[0045]图9为本公开另一实施例提供的应用场景的示意图;
[0046]图10为本公开实施例提供的声源定位装置的结构示意图;
[0047]图11为本公开实施例提供的智能设备的控制装置的结构示意图;
[0048]图12为本公开实施例提供的智能音箱的控制装置的结构示意图;
[0049]图13为本公开实施例提供的电子设备实施例的结构示意图。
具体实施方式
[0050]为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。...

【技术保护点】

【技术特征摘要】
1.一种声源定位方法,其中,所述方法包括:获取智能设备采集的多路音频信号;根据所述多路音频信号检测到唤醒所述智能设备的事件发生;根据所述多路音频信号的协方差矩阵、以及根据所述多路音频信号得到的干扰信号的协方差矩阵,确定用于控制所述智能设备的声源信号的协方差矩阵;根据所述声源信号的协方差矩阵、以及分布在所述智能设备预设范围内的多个定位点分别对应的导向向量,确定所述多个定位点分别对应的指向响应,并将所述多个定位点中指向响应最大的定位点作为声源的定位点。2.根据权利要求1所述的方法,其中,根据所述多路音频信号检测到唤醒所述智能设备的事件发生,包括:根据所述多路音频信号,检测唤醒关键词的存在概率;如果所述存在概率满足预设条件,确定唤醒所述智能设备的事件发生。3.根据权利要求2所述的方法,其中,根据所述多路音频信号,检测唤醒关键词的存在概率,包括:对所述多路音频信号分别进行回声消除,得到多路第一时频域信号;根据所述多路第一时频域信号,检测所述唤醒关键词的存在概率。4.根据权利要求3所述的方法,其中,对所述多路音频信号分别进行回声消除,得到多路第一时频域信号,包括:对所述多路音频信号分别进行傅里叶变换,得到所述多路音频信号分别对应的第二时频域信号;对所述多路音频信号分别对应的第二时频域信号进行回声消除,得到所述多路第一时频域信号。5.根据权利要求4所述的方法,其中,所述多路音频信号的协方差矩阵是根据所述多路第一时频域信号确定的。6.根据权利要求4所述的方法,其中,所述干扰信号的协方差矩阵是根据预设概率、以及所述多路第一时频域信号确定的,所述预设概率与所述存在概率相关。7.根据权利要求6所述的方法,其中,若所述存在概率大于预设值,则所述预设概率为0;若所述存在概率小于或等于预设值,则所述预设概率为1。8.一种智能设备的控制方法,其特征在于,所述方法包括:获取智能设备采集的多路音频信号;根据所述多路音频信号检测到唤醒所述智能设备的事件发生;根据所述多路音频信号的协方差矩阵、以及根据所述多路音频信号得到的干扰信号的协方差矩阵,确定用于控制所述智能设备的...

【专利技术属性】
技术研发人员:王子腾纳跃跃田彪付强
申请(专利权)人:阿里巴巴达摩院杭州科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1