设备交互方法和装置制造方法及图纸

技术编号:24582729 阅读:36 留言:0更新日期:2020-06-21 01:21
本申请实施例公开了设备交互方法和装置。上述方法的一具体实施方式包括:响应于设备被唤醒,确定唤醒设备的目标用户;获取目标用户的语音序列;对语音序列进行分析;根据分析结果,对目标用户进行响应。该实施方式可以使智能设备与目标用户进行交互,从而屏蔽无关语音,提高交互效率。

Equipment interaction methods and devices

【技术实现步骤摘要】
设备交互方法和装置
本申请实施例涉及计算机
,具体涉及设备交互方法和装置。
技术介绍
随着科技的发展,智能机器人逐渐走入人们的生活中,并且给人们的生活带来了很多便利。现有的智能机器人,需要使用者说出唤醒词唤醒设备。由于智能机器人无法判断收到的语音是使用者对话的声音,还是无关的杂音。因此,在交互过程中需要使用者多次使用唤醒词来唤醒智能机器人,以进行连续的人机对话。这样降低了交互效率,用户体验差。
技术实现思路
本申请实施例提出了设备交互方法和装置。第一方面,本申请实施例提供了一种设备交互方法,包括:响应于设备被唤醒,确定唤醒上述设备的目标用户;获取上述目标用户的语音序列;对上述语音序列进行分析;根据分析结果,对上述目标用户进行响应。在一些实施例中,上述设备通过以下至少一种方式被唤醒:监听到唤醒语音指令;通过上述设备所连接的图像采集装置采集的图像中包括正面的人脸图像。在一些实施例中,上述响应于设备被唤醒,唤醒上述设备的目标用户,包括:响应于上述设备被唤醒语音指令唤醒,确定上述唤醒语音指令的发声方向;确定上述发声方向处的至少一个用户为目标用户。在一些实施例中,上述确定上述发声方向处的至少一个用户为目标用户,包括:根据上述发声方向,调整上述图像采集装置的方向,以使上述图像采集装置采集上述发声方向的图像;对上述图像采集装置采集的图像进行人脸识别;将上述图像中包括的正面人脸图像对应的至少一个用户为目标用户。在一些实施例中,上述设备的交互模式包括单人交互模式和多人交互模式;以及上述将上述图像中包括的正面人脸图像对应的至少一个用户为目标用户,包括:响应于上述设备的交互模式为单人交互模式,将上述正面人脸图像中距离上述设备最近的人脸图像对应的用户作为目标用户;响应于上述设备的交互模式为多人交互模式,将上述正面人脸图像对应的多个用户作为目标用户。在一些实施例中,上述方法还包括:在响应上述目标用户之后,响应于上述图像采集装置实时采集的图像中包括上述目标用户的正面人脸图像,确定在预设时长内是否获取到上述目标用户的语音序列;响应于确定在预设时长内未获取到上述目标用户的语音序列,监听除上述目标用户之外的其它用户的唤醒语音指令。第二方面,本申请实施例提供了一种设备交互装置,包括:确定单元,被配置成响应于设备被唤醒,确定唤醒上述设备的目标用户;获取单元,被配置成获取上述目标用户的语音序列;分析单元,被配置成对上述语音序列进行分析;响应单元,被配置成根据分析结果,对上述目标用户进行响应。在一些实施例中,上述装置还包括唤醒单元,上述唤醒单元被配置成通过以下至少一种方式唤醒设备:监听到唤醒语音指令;通过上述设备所连接的图像采集装置采集的图像中包括正面的人脸图像。在一些实施例中,上述确定单元进一步被配置成:响应于上述设备被唤醒语音指令唤醒,确定上述唤醒语音指令的发声方向;确定上述发声方向处的至少一个用户为目标用户。在一些实施例中,上述确定单元进一步被配置成:根据上述发声方向,调整上述图像采集装置的方向,以使上述图像采集装置采集上述发声方向的图像;对上述图像采集装置采集的图像进行人脸识别;将上述图像中包括的正面人脸图像对应的至少一个用户为目标用户。在一些实施例中,上述设备的交互模式包括单人交互模式和多人交互模式;以及上述确定单元进一步被配置成:响应于上述设备的交互模式为单人交互模式,将上述正面人脸图像中距离上述设备最近的人脸图像对应的用户作为目标用户;响应于上述设备的交互模式为多人交互模式,将上述正面人脸图像对应的多个用户作为目标用户。在一些实施例中,上述装置还包括:判断单元,被配置成在响应上述目标用户之后,响应于上述图像采集装置实时采集的图像中包括上述目标用户的正面人脸图像,确定在预设时长内是否获取到上述目标用户的语音序列;监听单元,被配置成响应于确定在预设时长内未获取到上述目标用户的语音序列,监听除上述目标用户之外的其它用户的唤醒语音指令。第三方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行,使得上述一个或多个处理器实现如第一方面任一实施例所描述的方法。第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面任一实施例所描述的方法。本申请的上述实施例提供的设备交互方法和装置,在设备被唤醒后,可以确定唤醒设备的目标用户。然后,获取目标用户的语音序列。并对语音序列进行分析。最后,根据分析结果,对目标用户进行响应。本实施例的方法,可以使智能设备与目标用户进行交互,从而屏蔽无关语音,提高交互效率。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请的一个实施例可以应用于其中的示例性系统架构图;图2是根据本申请的设备交互方法的一个实施例的流程图;图3是根据本申请的设备交互方法的一个应用场景的示意图;图4是根据本申请的设备交互方法的另一个实施例的流程图;图5是根据本申请的设备交互装置的一个实施例的结构示意图;图6是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请的设备交互方法或设备交互装置的实施例的示例性系统架构100。如图1所示,系统架构100可以包括智能终端设备101、102、103,网络104和服务器105。网络104用以在智能终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。用户可以使用智能终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。智能终端设备101、102、103上可以安装有各种通讯客户端应用,例如语音识别类应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。智能终端设备101、102、103可以是硬件,也可以是软件。当智能终端设备101、102、103为硬件时,可以是具有语音识别功能的各种电子设备,包括但不限于智能手机、智能音箱、智能机器人等等。当智能终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。服务器105可以是提供各种服务的服务器,例如对智能终端设本文档来自技高网...

【技术保护点】
1.一种设备交互方法,包括:/n响应于设备被唤醒,确定唤醒所述设备的目标用户;/n获取所述目标用户的语音序列;/n对所述语音序列进行分析;/n根据分析结果,对所述目标用户进行响应。/n

【技术特征摘要】
1.一种设备交互方法,包括:
响应于设备被唤醒,确定唤醒所述设备的目标用户;
获取所述目标用户的语音序列;
对所述语音序列进行分析;
根据分析结果,对所述目标用户进行响应。


2.根据权利要求1所述的方法,其中,所述设备通过以下至少一种方式被唤醒:
监听到唤醒语音指令;
通过所述设备所连接的图像采集装置采集的图像中包括正面的人脸图像。


3.根据权利要求2所述的方法,其中,所述响应于设备被唤醒,唤醒所述设备的目标用户,包括:
响应于所述设备被唤醒语音指令唤醒,确定所述唤醒语音指令的发声方向;
确定所述发声方向处的至少一个用户为目标用户。


4.根据权利要求3所述的方法,其中,所述确定所述发声方向处的至少一个用户为目标用户,包括:
根据所述发声方向,调整所述图像采集装置的方向,以使所述图像采集装置采集所述发声方向的图像;
对所述图像采集装置采集的图像进行人脸识别;
将所述图像中包括的正面人脸图像对应的至少一个用户为目标用户。


5.根据权利要求4所述的方法,其中,所述设备的交互模式包括单人交互模式和多人交互模式;以及
所述将所述图像中包括的正面人脸图像对应的至少一个用户为目标用户,包括:
响应于所述设备的交互模式为单人交互模式,将所述正面人脸图像中距离所述设备最近的人脸图像对应的用户作为目标用户;
响应于所述设备的交互模式为多人交互模式,将所述正面人脸图像对应的多个用户作为目标用户。


6.根据权利要求1所述的方法,其中,所述方法还包括:
在响应所述目标用户之后,响应于所述图像采集装置实时采集的图像中包括所述目标用户的正面人脸图像,确定在预设时长内是否获取到所述目标用户的语音序列;
响应于确定在预设时长内未获取到所述目标用户的语音序列,监听除所述目标用户之外的其它用户的唤醒语音指令。


7.一种设备交互装置,包括:
确定单元,被配置成响应于设备被唤醒,确定唤醒所述设备的目标用户;
获取单元,被配置成获取所述目标用户的语音序列;
分析单元,被配置成对所述语音序列进行分析;<...

【专利技术属性】
技术研发人员:李扬陈肖坤李士岩郑磊
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1