一种语音唤醒方法及电子设备技术

技术编号:33641508 阅读:14 留言:0更新日期:2022-06-02 20:16
本申请提供了一种语音唤醒方法及电子设备,涉及终端人工智能领域。其中,该方法包括:通过利用各个设备采集的环境声音,一方面可以定位用户和多设备在空间中的相对位置,构建位置地图;另一方面可以借助多设备中有图像采集模块的主设备来采集用户的人脸朝向,这样,通过结合位置地图和主设备所采集用户的人脸朝向,就可以确定用户想要唤醒的设备,该方法有助于提高多设备场景中设备唤醒的准确性,应用效果也相对较好。效果也相对较好。效果也相对较好。

【技术实现步骤摘要】
一种语音唤醒方法及电子设备


[0001]本申请涉及终端
,尤其涉及一种语音唤醒方法及电子设备。

技术介绍

[0002]目前,用户可以通过说出唤醒词来唤醒电子设备,从而实现用户与电子设备之间的交互。通常情况下,唤醒词是由用户预先设置在电子设备中的,或者唤醒词是电子设备出厂之前设置好的。在多设备场景(如智能家居场景)下,用户为了方便记忆,可能会将多个设备设置了相同的唤醒词,例如,用户设置智慧屏、智能音箱、智能开关的唤醒词均为“小艺小艺”。如图1所示,假设用户只希望唤醒智慧屏,可是当用户说出“小艺小艺”后,智慧屏和音箱均被唤醒,均向用户反馈“我在”的语音响应,这样情况会给用户带来困扰,影响用户体验。

技术实现思路

[0003]本申请提供一种语音唤醒方法及电子设备,有助于提高在多设备场景中语音唤醒电子设备的准确性,从而提高用户体验。
[0004]第一方面,本申请实施例提供一种语音唤醒方法,该方法可以应用于第一电子设备,该方法涉及终端人工智能(artificial intelligence,AI)领域。该方法包括:
[0005]第一电子设备接收用户的语音唤醒指令;第一电子设备还获取用户图像,检测用户人脸朝向;接着,第一电子设备根据所述第一电子设备和至少一个第二电子设备的相对位置、用户位置和所述用户人脸朝向,从所述第一电子设备和至少一个第二电子设备中确定用户人脸所朝向的目标设备;最终第一电子设备指示所述目标设备响应所述语音唤醒指令。
[0006]其中,第一电子设备可以具有图像采集功能,第一电子设备从图像采集模块获取用户图像,第一电子设备也可以不具有图像采集功能,第一电子设备从第二电子设备获取用户图像。
[0007]本申请实施例中,第一电子设备通过第一电子设备和至少一个第二电子设备的相对位置,和设备所采集用户的人脸朝向,就可以确定用户想要唤醒的设备,该方法有助于提高多设备场景中设备唤醒的准确性,应用效果也相对较好。
[0008]在一种可能的设计中,当第二电子设确定用户人脸所朝向的候选设备的个数大于或等于两个时,第一电子设备需要确定所述用户和所述至少两个候选设备的相对距离;然后根据所述相对距离,确定所述候选设备的优先级,其中,相对距离越小的候选设备的优先级越小;最终确定最高优先级对应的候选设备为目标设备。
[0009]本申请实施例中,在指向性唤醒的基础上,有助于提高多设备场景中就近唤醒的准确性。
[0010]在另一种可能的设计中,当第二电子设确定用户人脸所朝向的候选设备的个数大于或等于两个时,第一电子设备需要确定所述用户和所述至少两个候选设备的相对距离;
最终确定最小相对距离对应的候选设备为目标设备。
[0011]本申请实施例中,在指向性唤醒的基础上,有助于提高多设备场景中就近唤醒的准确性。
[0012]在一种可能的设计中,第一电子设备可以获取第一电子设备的第一音频的信息,以及从至少一个第二电子设备获取第二音频的信息;然后根据第一音频的信息和第二音频的信息,确定所述用户位置。
[0013]本申请实施例中,通过电子设备的多麦克风阵列所采集到声音可以有效地确定用户位置,保证用户位置定位结果的准确性。
[0014]在一种可能的设计中,第一电子设备包括第一麦克风和第二麦克风;第一音频的信息包括:语音唤醒指令到达第一麦克风的第一到达时刻,语音唤醒指令到达第二麦克风的第二到达时刻,以及语音唤醒指令到达第一麦克风的第一相位、语音唤醒指令到达第二麦克风的第二相位;至少一个第二电子设备包括第三麦克风和第四麦克风;第二音频的信息包括:语音唤醒指令到达第三麦克风的第三到达时刻,语音唤醒指令到达第四麦克风的第四到达时刻,以及语音唤醒指令到达第三麦克风的第三相位、语音唤醒指令到达第四麦克风的第四相位。
[0015]在一种可能的设计中,第一电子设备可以根据第一音频的信息和第二音频的信息,确定用户位置,具体包括如下步骤:
[0016]根据第一到达时刻和第二到达时刻之间的时间差,确定用户和第一电子设备的相对距离,以及根据第一相位和第二相位之间的相位差,确定用户相对于第一电子设备的方位角;根据第二到达时刻和第三到达时刻之间的时间差,确定用户和至少一个第二电子设备的相对距离;以及根据第三相位和第四相位之间的相位差,确定用户相对于至少一个第二电子设备的方位角;根据用户和第一电子设备的相对距离、用户相对于第一电子设备的方位角和用户和至少一个第二电子设备的相对距离,以及用户相对于至少一个第二电子设备的方位角,确定用户位置。
[0017]本申请实施例中,通过电子设备的多麦克风阵列所采集到声音可以有效地确定用户位置,保证用户位置定位结果的准确性。
[0018]在一种可能的设计中,所述方法还包括:第一电子设备从所述第一电子设备和所述至少一个第二电子设备获取历史音频的信息;
[0019]第一电子设备从该历史音频的信息中,获取所述用户N次发出的语音唤醒指令到达不同电子设备的到达时刻和相位,其中N为正整数;然后第一电子设备根据所述用户N次发出的语音唤醒指令到达不同电子设备的到达时刻和相位,确定与用户N次发出的语音唤醒指令对应的相对方位角和距离差;
[0020]第一电子设备以用户N次发出的语音唤醒指令对应的相对方位角和距离差为观测值,建立目标函数;第一电子设备通过穷举搜索的方法对所述目标函数求解,得到所述第一电子设备和至少一个第二电子设备的相对位置。
[0021]本申请实施例中,第一电子设备可以按照上述方法定位多设备在空间中的相对位置,构建包括设备相对位置的位置地图。使得设备在干扰环境下也可以通过用户语音多个语音识别反向推导出多个拾音设备之间的相对位置,随着语音唤醒消息的增多,设备之间的定位会越发准确。
[0022]在一种可能的设计中,所述第一电子设备和所述至少一个第二电子设备连接同一局域网,或所述第一电子设备和所述至少一个第二电子设备预先绑定有同一用户账号,或者所述第一电子设备和所述至少一个第二电子设备绑定不同的用户帐号,且不同的用户帐号建立绑定关系。
[0023]第二方面,本申请实施例提供一种语音唤醒方法,该方法可以应用于第二电子设备,该方法包括:
[0024]第二电子设备采集周围环境的声音并转换成第二音频,然后第二电子设备将第二音频发送至第一电子设备,以及第二电子设备在检测到第二音频中的唤醒词时,向第一电子设备发送唤醒消息,第一电子设备可以根据第一音频的信息以及第一电子设备的第二音频的信息,确定用户位置,并在根据第一电子设备和至少一个第二电子设备的相对位置、用户位置和所述用户人脸朝向,确定目标设备是该第二电子设备的情况下,向该第二电子设备发送唤醒响应,第二电子设备接收来自第一电子设备的唤醒响应后,响应用户语音唤醒指令。
[0025]另一种可能的情况下,若第一电子设备根据第一电子设备和至少一个第二电子设备的相对位置、用户位置和用户人脸朝向,确定目标设备不是该第二电子设备的情况下,第一电子设备不向第二电子设备发送唤本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音唤醒方法,应用于第一电子设备,其特征在于,所述方法包括:接收用户的语音唤醒指令;获取用户图像,检测用户人脸朝向;根据所述第一电子设备和至少一个第二电子设备的相对位置、用户位置和所述用户人脸朝向,从所述第一电子设备和至少一个第二电子设备中确定用户人脸所朝向的目标设备;指示所述目标设备响应所述语音唤醒指令。2.根据权利要求1所述的方法,其特征在于,根据所述第一电子设备和至少一个第二电子设备的相对位置、用户位置和所述用户人脸朝向,确定用户人脸所朝向的目标设备,包括:根据所述第一电子设备和至少一个第二电子设备的相对位置、用户位置和所述用户人脸朝向,从所述第一电子设备和至少一个第二电子设备中确定用户人脸所朝向的候选设备;当所述候选设备的个数大于或等于两个时,确定所述用户和所述至少两个候选设备的相对距离;根据所述相对距离,确定所述候选设备的优先级,其中,相对距离越小的候选设备的优先级越小;确定最高优先级对应的候选设备为目标设备。3.根据权利要求1或2所述的方法,其特征在于,获取所述第一电子设备的第一音频的信息,以及从所述至少一个第二电子设备获取第二音频的信息;根据所述第一音频的信息和所述第二音频的信息,确定所述用户位置。4.根据权利要求3所述的方法,其特征在于,所述第一电子设备包括第一麦克风和第二麦克风;所述第一音频的信息包括:所述语音唤醒指令到达所述第一麦克风的第一到达时刻,所述语音唤醒指令到达所述第二麦克风的第二到达时刻,以及所述语音唤醒指令到达所述第一麦克风的第一相位、所述语音唤醒指令到达所述第二麦克风的第二相位;所述至少一个第二电子设备包括第三麦克风和第四麦克风;所述第二音频的信息包括:所述语音唤醒指令到达所述第三麦克风的第三到达时刻,所述语音唤醒指令到达所述第四麦克风的第四到达时刻,以及所述语音唤醒指令到达所述第三麦克风的第三相位、所述语音唤醒指令到达所述第四麦克风的第四相位。5.根据权利要求4所述的方法,其特征在于,根据所述第一音频的信息和所述第二音频的信息,确定所述用户位置,包括:根据所述第一到达时刻和第二到达时刻之间的时间差,确定所述用户和所述第一电子设备的相对距离,以及根据所述第一相位和第二相位之间的相位差,确定所述用户相对于所述第一电子设备的方位角;根据所述第二到达时刻和第三到达时刻之间的时间差,确定所述用户和所述至少一个第二电子设备的相对距离;以及根据所述第三相位和第四相位之间的相位差,确定所述用户相对于所述至少一个第二电子设备的方位角;根据所述用户和所述第一电子设备的相对距离、所述用户相对于所述第一电子设备的
方位角和所述用户和所述至少一个第二电子设备的相对距离,以及所述用户相对于所述至少一个第二电子设备的方位角,确定所述用户位置。6.根据权利要求1至5任一项所述的方法,其特征在于,所述方法还包括:从所述第一电子设备和所述至少一个第二电子设备获取历史音频的信息;从所述历史音频的信息中,获取所述用户N次发出的语音唤醒指令分别到达不同电子设备的到达时刻和相位,其中N为正整数;根据所述用户N次发出的语音唤醒指令到达不同电子设备的到达时刻和相位,确定与用户N次发出的语音唤醒指令对应的相对方位角和距离差;以用户N次发出的语音唤醒指令对应的相对方位角和距离差为观测值,建立目标函数;通过穷举搜索的方法对所述目标函数求解,得到所述第一电子设备和至少一个第二电子设备的相对位置。7.根据权利要求6所述的方法,其特征在于,根据所述用户N次发出的语音唤醒指令到达不同电子设备的到达时刻和相位,确定与用户N次发出的语音唤醒指令对应的相对方位角和距离差,包括:针对所述用户N次发出的语音唤醒指令中的第K次发出的语音唤醒指令,第K次为N次中的任意一次,用户所述第K次发出的语音唤醒指令对应的所述距离差满足如下公式一:Δτ1
·
v=a1
……
公式一其中,Δτ1为用户发出的唤醒信号到两个不同电子设备的时间差,v为声音传输的速度,a1为用户发声位置到两个不同电子设备的距离差;用户所述第K次发出的语音唤醒指令对应的所述相对方位角满足如下公式二:180
°‑
θA1

θB1=b1
……
公式二其中,θA1为用户发生位置相对于所述第二电子设备的方位角,θB1为用户发声位置相对于所述第一电子设备的方位角;θB1为发声点P1到B点与直角坐标系C的x轴的夹角,b1为用户发声位置相对于两个不同电子设备的相对方位角。8.根据权利要求1至7任一所述的方法,其特征在于,所述第一电子设备和所述至少一个第二电子设备连...

【专利技术属性】
技术研发人员:江昱成赵安林龙
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1