【技术实现步骤摘要】
智能语音设备控制方法、装置、计算机设备和存储介质
[0001]本申请是于2018年01月03日提交中国专利局,申请号为2018100052080,专利技术名称为“智能语音设备控制方法、装置、计算机设备和存储介质”的分案申请,其全部内容通过引用结合在本申请中。
[0002]本专利技术涉及计算机
,特别是涉及一种智能语音设备控制方法、装置、计算机设备和存储介质。
技术介绍
[0003]随着科学技术的飞速发展,人工智能技术凭借其带来的良好的便利性,越来越受到大家的欢迎。一些人工智能产品应运而生。比如,智能音箱,用户可以对智能音箱讲话,来实现一系列的交互控制。
[0004]传统的在使用智能音箱进行交互控制时,智能音箱要采集语音数据,从采集的语音数据中识别关键词来进行激活,然而语音数据中往往具有大量的干扰音,比如,房间外的马路上的嘈杂音等,由于这些大量的干扰,会造成根据语音数据来激活智能音箱的准确率较低。
技术实现思路
[0005]基于此,有必要针对传统方法根据语音数据来激活智能音箱的准确率较低的问题,提供一种智能语音设备控制方法、装置、计算机设备和存储介质。
[0006]一种智能语音设备控制方法,所述方法包括:
[0007]全息智能语音成像设备对绑定的虚拟交互角色进行全息投影,以在全息智能语音成像设备上呈现三维全息虚拟交互角色;
[0008]获取在视频采集范围内采集的图像;
[0009]当在所述图像中识别到用户对象时,则控制所述三维全息虚拟交互角色始终保持 ...
【技术保护点】
【技术特征摘要】
1.一种智能语音设备控制方法,所述方法包括:全息智能语音成像设备对绑定的虚拟交互角色进行全息投影,以在全息智能语音成像设备上呈现三维全息虚拟交互角色;获取在视频采集范围内采集的图像;当在所述图像中识别到用户对象时,则控制所述三维全息虚拟交互角色始终保持朝向所述用户对象所表征的用户在现实场景中所处的方位;在所述图像中所述用户对象对应的视线方向指向所述三维全息虚拟交互角色的情况下,控制所述全息智能语音成像设备进入唤醒状态。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取语音数据;所述在所述图像中所述用户对象对应的视线方向指向所述三维全息虚拟交互角色的情况下,控制所述全息智能语音成像设备进入唤醒状态包括:在所述图像中所述用户对象对应的视线方向指向所述三维全息虚拟交互角色、且所述语音数据中存在预设唤醒词的情况下,控制所述全息智能语音成像设备进入唤醒状态。3.根据权利要求1所述的方法,其特征在于,所述当在所述图像中识别到用户对象时,则控制所述三维全息虚拟交互角色始终保持朝向所述用户对象所表征的用户在现实场景中所处的方位包括:当在所述图像中识别到用户对象时,则进入近场交互模式,并按照所述近场交互模式对应的交互处理逻辑,控制所述三维全息虚拟交互角色始终保持朝向所述用户对象所表征的用户在现实场景中所处的方位。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:当在所述图像中未识别到用户对象、且获取到语音数据时,则进入远场交互模式,则在获取的语音数据符合远场交互模式下的唤醒条件时,控制所述全息智能语音成像设备进入唤醒状态。5.根据权利要求4所述的方法,其特征在于,本地与绑定于所述虚拟交互角色的至少一个非本地的智能语音设备连接于同一网络;所述在获取的语音数据符合远场交互模式下的唤醒条件时,控制所述全息智能语音成像设备进入唤醒状态包括:在符合远场交互模式下的唤醒条件时,发送获取的语音数据至服务器;接收服务器返回的目标设备指定指令,所述目标设备指定指令是在所述语音数据与相似的语音数据相比音量最大时接收到,所述相似的语音数据为非本地的智能语音设备发送的与所述语音数据相似的语音数据;响应于所述目标设备指定指令,控制所述全息智能语音成像设备进入唤醒状态。6.根据权利要求1至5中任一项所述的方法,其特征在于,所述当在所述图像中识别到用户对象时,则控制所述三维全息虚拟交互角色始终保持朝向所述用户对象所表征的用户在现实场景中所处的方位包括:识别所述图像中的用户对象位置;将所述用户对象位置映射为现实场景中的用户位置;控制所述三维全息虚拟交互角色的朝向,使所述朝向随着所述用户位置的移动而变
化、且保持始终朝向所述用户位置所处的方位。7.根据权利要求1所述的方法,其特征在于,还包括:获取包括命令语句的语音数据;在进入唤醒状态后,对所述命令语句进行语义分析;根据所述语义分析的结果,生成与所述命令语句相应的操作指令并执行。8...
【专利技术属性】
技术研发人员:梁栋,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。