本申请提供一种智能设备语音交互方法、装置、电子设备及存储介质,该方法包括:获取目标区域内各智能设备的接收信号;当任一智能设备的接收信号表征该智能设备接收到预设唤醒口令时,将该智能设备确定为被唤醒设备;当被唤醒设备的数量大于1时,根据各被唤醒设备的接收信号,确定各被唤醒设备的平均语音存在概率和短时能量;根据各被唤醒设备的平均语音存在概率和短时能量的加权计算结果,在被唤醒设备中选择目标唤醒设备,以基于目标唤醒设备进行语音交互任务。通过根据短时能量和平均语音存在概率两个指标的加权计算结果,选择目标唤醒设备,从而保证在噪声环境下选择唤醒设备具有一定程度的鲁棒性,提高了最终选择的目标唤醒设备的可靠性。设备的可靠性。设备的可靠性。
【技术实现步骤摘要】
一种智能设备语音交互方法、装置、电子设备及存储介质
[0001]本申请涉及人工智能
,尤其涉及一种智能设备语音交互方法、装置、电子设备及存储介质。
技术介绍
[0002]随着智能家居的普及,更多家庭拥有了越来越多的带有语音交互功能的智能设备,这些智能设备内部均带有一个麦克风或由多个麦克风组成的麦克风阵列,从而实现语音交互功能,并且设备的摆放不受空间限制,在家中呈现分布式格局。当用户需要控制某个目标智能设备时,先用唤醒口令在这些智能设备中选择一个唤醒设备,以基于该唤醒设备进行后续的语音交互任务。
[0003]在现有技术中,通常是在用户发出唤醒口令后,根据区域内各智能设备接收信号的短时能量来选择其中一个设备作为唤醒设备。但是,短时能量易受周围噪声环境噪声或设备本机噪声影响,鲁棒性不高,无法保证最终选择的唤醒设备的可靠性。
技术实现思路
[0004]本申请提供一种智能设备语音交互方法、装置、电子设备及存储介质,以解决现有技术无法保证最终选择的唤醒设备的可靠性等缺陷。
[0005]本申请第一个方面提供一种智能设备语音交互方法,包括:
[0006]获取目标区域内各智能设备的接收信号;
[0007]当任一所述智能设备的接收信号表征该智能设备接收到预设唤醒口令时,将该智能设备确定为被唤醒设备;
[0008]当所述被唤醒设备的数量大于1时,根据各所述被唤醒设备的接收信号,确定各所述被唤醒设备的平均语音存在概率和短时能量;
[0009]根据各所述被唤醒设备的平均语音存在概率和短时能量的加权计算结果,在若干个所述被唤醒设备中选择目标唤醒设备,以基于所述目标唤醒设备进行语音交互任务。
[0010]可选的,所述根据各所述被唤醒设备的接收信号,确定各所述被唤醒设备的平均语音存在概率和短时能量,包括:
[0011]针对任一所述被唤醒设备,将该被唤醒设备的接收信号,转换为频域信号;
[0012]根据所述频域信号,确定该被唤醒设备的频域平滑功率谱和频域功率最小值;
[0013]根据所述频域平滑功率谱和频域功率最小值,确定该被唤醒设备的平均语音存在概率;
[0014]将该被唤醒设备的接收信号,转换为时域信号;
[0015]根据所述时域信号,确定所述被唤醒设备的短时能量。
[0016]可选的,所述根据各所述被唤醒设备的平均语音存在概率和短时能量的加权计算结果,在若干个所述被唤醒设备中选择目标唤醒设备,包括:
[0017]对各所述被唤醒设备的短时能量进行归一化处理,以得到各所述被唤醒设备的归
一化短时能量;
[0018]按照预设的加权系数,对所述归一化短时能量和平均语音存在概率进行加权计算,得到各所述被唤醒设备对应的加权计算结果;
[0019]将最大加权计算结果对应的被唤醒设备,确定为所述目标唤醒设备。
[0020]可选的,还包括:
[0021]根据各所述被唤醒设备的接收信号,确定所述目标唤醒设备与各所述被唤醒设备之间的加权广义互相关函数;
[0022]对所述加权广义互相关函数进行归一化处理,得到所述目标唤醒设备与各所述被唤醒设备之间的归一化加权广义互相关函数;
[0023]根据所述归一化加权广义互相关函数表征的接收信号相关度,在所述被唤醒设备中筛选语音增强设备;
[0024]基于所述目标唤醒设备和语音增强设备,构建目标分布式麦克风矩阵;
[0025]在基于所述目标唤醒设备进行语音交互任务的过程中,基于所述目标分布式麦克风矩阵进行语音增强。
[0026]可选的,所述根据各所述被唤醒设备的接收信号,确定所述目标唤醒设备与各所述被唤醒设备之间的加权广义互相关函数,包括:
[0027]根据如下公式,确定所述目标唤醒设备与各所述被唤醒设备之间的加权广义互相关函数:
[0028][0029]其中,R
I,q
(t)表示目标唤醒设备和第q个被唤醒设备的接收信号在第t帧的加权广义互相关函数,α
R
表示加权广义互相关函数的平滑因子,IFFT(
·
)表示逆傅里叶变换,(
·
)
*
表示取共轭,p
I
(t,f)表示目标唤醒设备在第t帧、第f个频点的语音存在概率,p
q
(t,f)表示第q个被唤醒设备在第t帧、第f个频点的语音存在概率,Y
I,1
(t,f)表示目标唤醒设备第1个通道在第t帧、第f个频点的频域信号,Y
q,1
(t,f)表示第q个被唤醒设备第1个通道在第t帧、第f个频点的频域信号。
[0030]可选的,所述对所述加权广义互相关函数进行归一化处理,得到所述目标唤醒设备与各所述被唤醒设备之间的归一化加权广义互相关函数,包括:
[0031]根据如下公式,对所述加权广义互相关函数进行归一化处理,得到所述目标唤醒设备与各所述被唤醒设备之间的归一化加权广义互相关函数:
[0032][0033]其中,表示目标唤醒设备与第q个被唤醒设备的接收信号在第t帧的归一化加权广义互相关函数,max{
·
}表示取最大值。
[0034]可选的,所述根据所述归一化加权广义互相关函数表征的接收信号相关度,在所述被唤醒设备中筛选语音增强设备,包括:
[0035]根据所述目标唤醒设备与各所述被唤醒设备之间的归一化加权广义互相关函数,计算归一化加权广义互相关函数平均功率的倒数;
[0036]针对任一所述被唤醒设备,根据该被唤醒设备与目标唤醒设备之间的归一化加权广义互相关函数平均功率的倒数,以及该被唤醒设备和目标唤醒设备的唤醒时刻,确定该被唤醒设备和目标唤醒设备的接收信号相关度;
[0037]若该被唤醒设备和目标唤醒设备的接收信号相关度达到预设阈值,则将该被唤醒设备确定为所述语音增强设备。
[0038]本申请第二个方面提供一种智能设备语音交互装置,包括:
[0039]获取模块,用于获取目标区域内各智能设备的接收信号;
[0040]唤醒模块,用于当任一所述智能设备的接收信号表征该智能设备接收到预设唤醒口令时,将该智能设备确定为被唤醒设备;
[0041]确定模块,用于当所述被唤醒设备的数量大于1时,根据各所述被唤醒设备的接收信号,确定各所述被唤醒设备的平均语音存在概率和短时能量;
[0042]语音交互模块,用于根据各所述被唤醒设备的平均语音存在概率和短时能量的加权计算结果,在若干个所述被唤醒设备中选择目标唤醒设备,以基于所述目标唤醒设备进行语音交互任务。
[0043]本申请第三个方面提供一种电子设备,包括:至少一个处理器和存储器;
[0044]所述存储器存储计算机执行指令;
[0045]所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一个方面以及第一个方面各种可能的设计所述的方法。
...
【技术保护点】
【技术特征摘要】
1.一种智能设备语音交互方法,其特征在于,包括:获取目标区域内各智能设备的接收信号;当任一所述智能设备的接收信号表征该智能设备接收到预设唤醒口令时,将该智能设备确定为被唤醒设备;当所述被唤醒设备的数量大于1时,根据各所述被唤醒设备的接收信号,确定各所述被唤醒设备的平均语音存在概率和短时能量;根据各所述被唤醒设备的平均语音存在概率和短时能量的加权计算结果,在若干个所述被唤醒设备中选择目标唤醒设备,以基于所述目标唤醒设备进行语音交互任务。2.根据权利要求1所述的方法,其特征在于,所述根据各所述被唤醒设备的接收信号,确定各所述被唤醒设备的平均语音存在概率和短时能量,包括:针对任一所述被唤醒设备,将该被唤醒设备的接收信号,转换为频域信号;根据所述频域信号,确定该被唤醒设备的频域平滑功率谱和频域功率最小值;根据所述频域平滑功率谱和频域功率最小值,确定该被唤醒设备的平均语音存在概率;将该被唤醒设备的接收信号,转换为时域信号;根据所述时域信号,确定所述被唤醒设备的短时能量。3.根据权利要求1所述的方法,其特征在于,所述根据各所述被唤醒设备的平均语音存在概率和短时能量的加权计算结果,在若干个所述被唤醒设备中选择目标唤醒设备,包括:对各所述被唤醒设备的短时能量进行归一化处理,以得到各所述被唤醒设备的归一化短时能量;按照预设的加权系数,对所述归一化短时能量和平均语音存在概率进行加权计算,得到各所述被唤醒设备对应的加权计算结果;将最大加权计算结果对应的被唤醒设备,确定为所述目标唤醒设备。4.根据权利要求1所述的方法,其特征在于,还包括:根据各所述被唤醒设备的接收信号,确定所述目标唤醒设备与各所述被唤醒设备之间的加权广义互相关函数;对所述加权广义互相关函数进行归一化处理,得到所述目标唤醒设备与各所述被唤醒设备之间的归一化加权广义互相关函数;根据所述归一化加权广义互相关函数表征的接收信号相关度,在所述被唤醒设备中筛选语音增强设备;基于所述目标唤醒设备和语音增强设备,构建目标分布式麦克风矩阵;在基于所述目标唤醒设备进行语音交互任务的过程中,基于所述目标分布式麦克风矩阵进行语音增强。5.根据权利要求4所述的方法,其特征在于,所述根据各所述被唤醒设备的接收信号,确定所述目标唤醒设备与各所述被唤醒设备之间的加权广义互相关函数,包括:根据如下公式,确定所述目标唤醒设备与各所述被唤醒设备之间的加权广义互相关函数:
其中,R
I,q
(t)表示目标唤醒设备和第q个被唤醒设备的接收信号在第t帧的加权广义互相关函数,α
R
表示加权广义互相关函数的平滑因子,IFFT(
·
)表示逆傅里叶变换,(
·
)...
【专利技术属性】
技术研发人员:李逸洋,张新科,崔潇潇,鲁勇,
申请(专利权)人:北京探境科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。