一种语音唤醒方法及电子设备技术

技术编号:22469277 阅读:29 留言:0更新日期:2019-11-06 12:20
本申请提供一种语音唤醒方法及电子设备,涉及终端技术领域,可在较广的位置范围内保证电子设备能够成功被唤醒的几率,提高语音助手在各个位置下的唤醒率和用户的使用体验。该方法包括:电子设备获取摄像头采集的图像;电子设备确定该图像包括用户;电子设备确定该图像中第一用户所在的第一目标位置;电子设备处理用户输入的第一语音;其中,若第一目标位置属于预设的第一区域,则电子设备使用第一参数处理第一语音;若第一目标位置属于预设的第二区域,则电子设备使用第二参数处理第一语音,第二区域与第一区域不同,第二参数与第一参数不同;若处理后的第一语音中包括预设的唤醒词,则电子设备从第一状态切换为第二状态。

A voice wake-up method and electronic equipment

【技术实现步骤摘要】
一种语音唤醒方法及电子设备
本申请涉及终端
,尤其涉及一种语音唤醒方法及电子设备。
技术介绍
随着语音识别技术的发展,许多电子设备中添加了语音助手(例如Siri、小爱同学、小E等)来帮助用户完成与电子设备的人机交互过程。为了使语音助手能够及时检测并响应用户发出的语音指令,电子设备中一般会预先设置一个或多个唤醒词(例如,“你好,小E”、“hiSiri”等)。当检测到用户输入预设的唤醒词时,说明用户此时具有语音交互的使用意图,因此,可触发电子设备启动语音助手与用户进行语音交流。一般,电子设备可使用预先设置好的唤醒参数检测用户是否输入唤醒词。以声强门限为一个唤醒参数举例,电子设备可将唤醒词的声强门限设置为60dB。也就是说,当用户输入唤醒词时的声强大于60dB时,电子设备可确认用户输入了唤醒词从而唤醒语音助手。但是,当用户距离电子设备较远时,电子设备检测到用户输入的声强也随之降低,从而导致用户距离电子设备较远时无法唤醒语音助手的情况。
技术实现思路
本申请提供一种语音唤醒方法及电子设备,可在较广的位置范围内保证电子设备能够成功被唤醒的几率,提高语音助手在各个位置下的唤醒率和用户的使用体验。为达到上述目的,本申请采用如下技术方案:第一方面,本申请提供一种语音唤醒方法,包括:电子设备获取摄像头采集的图像;进而,电子设备可确定采集的图像中是否包括用户;如果该图像中包括用户,则电子设备可确定上述图像中第一用户所在的第一目标位置;后续,用户输入第一语音后,电子设备可根据第一目标位置处理该第一语音;例如,若第一目标位置属于预设的第一区域,则电子设备可使用第一参数处理第一语音;若第一目标位置属于预设的第二区域,则电子设备可使用第二参数处理第一语音;那么,若处理后的第一语音中包括预设的唤醒词,则电子设备的语音交互功能被唤醒,此时电子设备的语音交互功能从第一状态(例如待机状态)切换为第二状态(例如工作状态)。也就是说,电子设备可以根据用户所在的位置动态的设置不同的参数检测语音中的唤醒词,使得用户在不同位置输入唤醒词时,电子设备可使用对应的参数检测用户输入的唤醒词,使得电子设备在不同位置场景下均能够保持较高的唤醒率,提高语音交互场景下用户的使用体验。需要说明的是,电子设备处理第一语音的过程可以包括电子设备采集用户输入的第一语音的过程,也可以包括电子设备采集到第一语音后,对第一语音进行模数转换、降噪或信号放大等语音处理过程,本申请对此不做任何限制。在一种可能的实现方式中,上述图像中可包括多个用户,此时,在电子设备确定该图像中第一用户所在的第一目标位置之前,还包括:电子设备从上述多个用户中确定第一用户。示例性的,上述第一用户可以为上述多个用户中优先级最高的用户。或者,上述第一用户可以为第一区域中的一个或多个用户,第一区域中的用户数量在预设的N个区域中最多,N为大于1的整数。也就是说,当某个区域中的用户数量最多时,该区域的优先级最高,该区域中的一个或多个用户即为第一用户。在一种可能的实现方式中,上述第一参数可以包括:第一唤醒门限、第一拾音方向、第一噪声抑制参数以及第一放大增益中的一项或多项;类似的,上述第二参数可以包括:第二唤醒门限、第二拾音方向、第二噪声抑制参数以及第二放大增益中的一项或多项。这些参数是指能够影响电子设备唤醒率的一项或多项参数。在一种可能的实现方式中,电子设备使用第一参数处理第一语音,包括:电子设备可使用第一唤醒门限判断是否需要处理第一语音;或;电子设备可使用第一拾音方向采集第一语音;或;电子设备可使用第一噪声抑制参数抑制第一语音中的噪声;或;电子设备可按照第一放大增益增强第一语音的响度。在一种可能的实现方式中,电子设备使用第二参数处理第一语音,包括:电子设备可使用第二唤醒门限判断是否需要处理第一语音;或;电子设备可使用第二拾音方向采集第一语音;或;电子设备可使用第二噪声抑制参数抑制第一语音中的噪声;或;电子设备可按照第二放大增益增强第一语音的响度。在一种可能的实现方式中,电子设备获取摄像头采集的图像,包括:当检测到电子设备上电、待机、开机或开始播放后,电子设备可以开始获取摄像头采集的每一帧图像。第二方面,本申请提供一种电子设备,包括:一个或多个摄像头;一个或多个麦克风;一个或多个处理器;存储器以及一个或多个计算机程序;其中,处理器与摄像头、麦克风和存储器均耦合,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述任一项所述的语音唤醒方法。第三方面,本申请提供一种计算机存储介质,包括计算机指令,当计算机指令在电子设备上运行时,使得电子设备执行如第一方面中任一项所述的语音唤醒方法。第四方面,本申请提供一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备执行如第一方面中任一项所述的语音唤醒方法。可以理解地,上述提供的第二方面所述的电子设备、第三方面所述的计算机存储介质,以及第四方面所述的计算机程序产品均用于执行上文所提供的对应的方法,因此,其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果,此处不再赘述。附图说明图1为一种语音交互过程的交互示意图;图2为本申请实施例提供的一种语音唤醒方法的应用场景示意图一;图3为本申请实施例提供的一种电子设备的结构示意图一;图4为本申请实施例提供的一种语音唤醒方法的流程示意图;图5为本申请实施例提供的一种语音唤醒方法的应用场景示意图二;图6为本申请实施例提供的一种语音唤醒方法的应用场景示意图三;图7为本申请实施例提供的一种语音唤醒方法的应用场景示意图四;图8为本申请实施例提供的一种语音唤醒方法的应用场景示意图五;图9为本申请实施例提供的一种语音唤醒方法的应用场景示意图六;图10为本申请实施例提供的一种语音唤醒方法的应用场景示意图七;图11为本申请实施例提供的一种语音唤醒方法的应用场景示意图八;图12为本申请实施例提供的一种电子设备的结构示意图二。具体实施方式下面将结合附图对本实施例的实施方式进行详细描述。本申请实施例提供的一种语音唤醒方法可应用于音箱、智能家居设备(例如智能电视、智能空调、智能冰箱等)、手机、平板电脑、笔记本电脑、上网本、个人数字助理(personaldigitalassistant,PDA)、可穿戴电子设备、车载设备或虚拟现实设备等具有语音交互功能的电子设备,本申请实施例对此不做任何限制。一般,语音交互过程可被划分为五个环节,即唤醒、响应、输入、理解和反馈。在与电子设备进行语音交互前需要先唤醒电子设备。例如,用户可通过输入正确的唤醒词激活电子设备的语音交互功能,使电子设备的语音交互功能从待机状态(即第一状态)切换到工作状态(即第二状态)。其中,当电子设备的语音交互功能处于待机状态时,电子设备接收到用户输入的语音信号后,需要对语音信号中的唤醒词进行识别。如果识别出预设的唤醒词,则电子设备可开启语音交互功能进入工作状态。当电子设备的语音交互功能处于工作状态时,电子设备在接收到用户输入的语音信号后,可通过语音识别算法识别该语音信号中的语义内容,从而响应该语音信号实现对应的功能。以音箱为上述电子设备举例,如果用于唤醒音箱的唤醒词为“小艺小艺”,则用户与音箱进行本文档来自技高网...

【技术保护点】
1.一种语音唤醒方法,其特征在于,包括:电子设备获取摄像头采集的图像;所述电子设备确定所述图像包括用户;响应于所述电子设备确定所述图像包括所述用户,所述电子设备确定所述图像中第一用户所在的第一目标位置;所述电子设备处理用户输入的第一语音;其中,若所述第一目标位置属于预设的第一区域,则所述电子设备使用第一参数处理所述第一语音;若所述第一目标位置属于预设的第二区域,则所述电子设备使用第二参数处理所述第一语音,所述第二区域与所述第一区域不同,所述第二参数与所述第一参数不同;若处理后的所述第一语音中包括预设的唤醒词,则所述电子设备从第一状态切换为第二状态。

【技术特征摘要】
1.一种语音唤醒方法,其特征在于,包括:电子设备获取摄像头采集的图像;所述电子设备确定所述图像包括用户;响应于所述电子设备确定所述图像包括所述用户,所述电子设备确定所述图像中第一用户所在的第一目标位置;所述电子设备处理用户输入的第一语音;其中,若所述第一目标位置属于预设的第一区域,则所述电子设备使用第一参数处理所述第一语音;若所述第一目标位置属于预设的第二区域,则所述电子设备使用第二参数处理所述第一语音,所述第二区域与所述第一区域不同,所述第二参数与所述第一参数不同;若处理后的所述第一语音中包括预设的唤醒词,则所述电子设备从第一状态切换为第二状态。2.根据权利要求1所述的方法,其特征在于,所述图像包括多个用户,在所述电子设备确定所述图像中第一用户所在的第一目标位置之前,还包括:所述电子设备从所述多个用户中确定所述第一用户。3.根据权利要求2所述的方法,其特征在于,所述第一用户为所述多个用户中优先级最高的用户。4.根据权利要求2所述的方法,其特征在于,若所述第一区域中的用户数量在预设的N个区域中最多,则所述第一用户为所述第一区域中的一个或多个用户,N为大于1的整数。5.根据权利要求1-4中任一项所述的方法,其特征在于,所述第一参数包括:第一唤醒门限、第一拾音方向、第一噪声抑制参数以及第一放大增益中的一项或多项;所述第二参数包括:第二唤醒门限、第二拾音方向、第二噪声抑制参数以及第二放大增益中的一项或多项。6.根据权利要求5所述的方法,其特征在于,所述电子设备使用第一参数处理所述第一语音,包括:所述电子设备使用所述第一唤醒门限判断是否处理所述第一语音;或;所述电子设备使用所述第一拾音方向采集所述第一语音;或;所述电子设备使用所述第一噪声抑制参数抑制所述第一语音中的噪声;或;所述电子设备按照所述第一放大增益增强所述第一语音的响度。7.根据权利要求5所述的方法,其特征在于,所述电子设备使用第二参数处理所述第一语音,包括:所述电子设备使用所述第二唤醒门限判断是否处理所述第一语音;或;所述电子设备使用所述第二拾音方向采集所述第一语音;或;所述电子设备使用所述第二噪声抑制参数抑制所述第一语音中的噪声;或;所述电子设备按照所述第二放大增益增强所述第一语音的响度。8.根据权利要求1-7中任一项所述的方法,其特征在于,所述电子设备获取摄像头采集的图像,包括:当检测到所述电子设备上电、待机、开机或开始播放后,所述电子设备开始获取摄像头采集的每一帧图像。9.一种电子设备,其特征在于,包括:一个或多个摄像头;一个或多个麦克风;一个或多个处理器;存储器;其中,所述存储器中存储有一个或多个计算机程序,所述一个或多个计算机程序包括指令,当所述指令被所述电子设备...

【专利技术属性】
技术研发人员:陈祥
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1