用于终端的交互方法和装置制造方法及图纸

技术编号:22022186 阅读:31 留言:0更新日期:2019-09-04 01:16
本申请实施例公开了用于终端的交互方法和装置。上述方法的一具体实施方式包括:获取图像序列,其中,图像序列至少一帧用户图像;根据图像序列,确定预设的唤醒条件是否满足;响应于确定唤醒条件满足,确定与唤醒条件对应的应答语音;播放应答语音。该实施方式可以根据用户图像来唤醒终端,增加了交互方式。

Interactive methods and devices for terminals

【技术实现步骤摘要】
用于终端的交互方法和装置
本申请实施例涉及计算机
,具体涉及用于终端的交互方法和装置。
技术介绍
随着科技的不断进步,智能终端逐渐出现在了人们的视野中。上述智能终端包括智能音箱、智能电视、智能照相机、智能机器人等。这些智能终端出色的地方在于它不仅可以播放音视频,还能与用户进行语音交互。现有的智能终端交互方式较简单,用户体验不佳。
技术实现思路
本申请实施例提出了用于终端的交互方法和装置。第一方面,本申请实施例提供了一种用于终端的交互方法,包括:获取图像序列,其中,上述图像序列包括至少一帧用户图像;根据上述图像序列,确定预设的唤醒条件是否满足;响应于确定上述唤醒条件满足,确定与上述唤醒条件对应的应答语音;播放上述应答语音。在一些实施例中,上述图像序列包括用户的眼部图像;以及上述根据上述图像序列,检测预设的唤醒条件是否满足,包括:对上述眼部图像进行分析,确定上述用户是否注视终端;响应于确定上述用户注视终端,确定上述唤醒条件满足。在一些实施例中,上述响应于确定上述唤醒条件满足,确定与上述唤醒条件对应的应答语音,包括:响应于确定上述唤醒条件满足,获取预设时长内的第一语音信息;对上述第一语音信息进行语义解析;根据语义解析结果,确定与上述唤醒条件对应的应答语音。在一些实施例中,上述图像序列包括用户的面部图像;以及上述根据上述图像序列,检测预设的唤醒条件是否满足,包括:对上述图像序列中的面部图像进行表情识别;根据表情识别结果,确定上述图像序列中相邻两帧图像对应的表情是否相同;响应于确定上述图像序列中相邻两帧图像对应的表情不同,确定上述唤醒条件满足。在一些实施例中,上述响应于确定上述唤醒条件满足,确定与上述唤醒条件对应的应答语音,包括:响应于确定上述唤醒条件满足,确定与相邻两帧图像中后一帧图像对应的表情对应的应答语音;将所确定的应答语音作为与上述唤醒条件对应的应答语音。在一些实施例中,上述图像序列包括用户的身体图像;以及上述根据上述图像序列,检测预设的唤醒条件是否满足,包括:对上述图像序列中的身体图像进行分析,确定用户的动作信息;响应于确定用户的动作信息满足预设条件,确定上述唤醒条件满足。在一些实施例中,上述响应于确定上述唤醒条件满足,确定与上述唤醒条件对应的应答语音,包括:确定与上述动作信息对应的应答语音作为与上述唤醒条件对应的应答语音。在一些实施例中,上述检测预设的唤醒条件是否满足,包括:响应于接收到服务端发送的应答语音,确定上述唤醒条件满足。在一些实施例中,上述方法还包括:响应于上述应答语音的播放完成,获取预设时长内的第二语音信息;根据上述第二语音信息,控制上述终端。第二方面,本申请实施例提供了一种用于终端的交互装置,包括:图像序列获取单元,被配置成获取图像序列,其中,上述图像序列包括至少一帧用户图像;条件判断单元,被配置成根据上述图像序列,确定预设的唤醒条件是否满足;应答语音确定单元,被配置成响应于确定上述唤醒条件满足,确定与上述唤醒条件对应的应答语音;应答语音播放单元,被配置成播放上述应答语音。在一些实施例中,上述图像序列包括用户的眼部图像;以及上述条件判断单元进一步被配置成:对上述眼部图像进行分析,确定上述用户是否注视终端;响应于确定上述用户注视终端,确定上述唤醒条件满足。在一些实施例中,上述应答语音确定单元进一步被配置成:响应于确定上述唤醒条件满足,获取预设时长内的第一语音信息;对上述第一语音信息进行语义解析;根据语义解析结果,确定与上述唤醒条件对应的应答语音。在一些实施例中,上述图像序列包括用户的面部图像;以及上述条件判断单元进一步被配置成:对上述图像序列中的面部图像进行表情识别;根据表情识别结果,确定上述图像序列中相邻两帧图像对应的表情是否相同;响应于确定上述图像序列中相邻两帧图像对应的表情不同,确定上述唤醒条件满足。在一些实施例中,上述应答语音确定单元进一步被配置成:响应于确定上述唤醒条件满足,确定与相邻两帧图像中后一帧图像对应的表情对应的应答语音;将所确定的应答语音作为与上述唤醒条件对应的应答语音。在一些实施例中,上述图像序列包括用户的身体图像;以及上述条件判断单元进一步被配置成:对上述图像序列中的身体图像进行分析,确定用户的动作信息;响应于确定用户的动作信息满足预设条件,确定上述唤醒条件满足。在一些实施例中,上述应答语音确定单元进一步被配置成:确定与上述动作信息对应的应答语音作为与上述唤醒条件对应的应答语音。在一些实施例中,上述条件判断单元进一步被配置成:响应于接收到服务端发送的应答语音,确定上述唤醒条件满足。在一些实施例中,上述装置还包括:语音信息获取单元,被配置成响应于上述应答语音的播放完成,获取预设时长内的第二语音信息;终端控制单元,被配置成根据上述第二语音信息,控制上述终端。第三方面,本申请实施例提供了一种终端,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行,使得上述一个或多个处理器实现如第一方面任一实施例所描述的方法。第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面任一实施例所描述的方法。本申请的上述实施例提供的用于终端的交互方法和装置,可以获取图像序列。图像序列中包括至少一帧用户图像。然后,根据图像序列,确定预设的唤醒条件是否满足。在确定唤醒条件满足后,确定与唤醒条件对应的应答语音。最后,播放应答语音。本实施例的方法,可以根据用户图像来唤醒终端,增加了交互方式。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请的一个实施例可以应用于其中的示例性系统架构图;图2是根据本申请的用于终端的交互方法的一个实施例的流程图;图3a是根据本申请的用于终端的交互方法的一个应用场景的示意图;图3b是根据本申请的用于终端的交互方法的另一个应用场景的示意图;图3c是根据本申请的用于终端的交互方法的又一个应用场景的示意图;图4是根据本申请的用于终端的交互方法的又一个实施例的流程图;图5是根据本申请的用于终端的交互装置的一个实施例的结构示意图;图6是适于用来实现本申请实施例的终端的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请的用于终端的交互方法或用于终端的交互装置的实施例的示例性系统架构100。如图1所示,系统架构100可以包括智能音箱101,终端设备102、103,网络104和服务器105。网络104用以在智能音箱101,终端设备102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。智能音箱101上可以安装有图像采集装置,可以采集用户图像,然后通过网络104与服务器105交互,以接收或发送消息。例如,将采集的本文档来自技高网...

【技术保护点】
1.一种用于终端的交互方法,包括:获取图像序列,其中,所述图像序列包括至少一帧用户图像;根据所述图像序列,确定预设的唤醒条件是否满足;响应于确定所述唤醒条件满足,确定与所述唤醒条件对应的应答语音;播放所述应答语音。

【技术特征摘要】
1.一种用于终端的交互方法,包括:获取图像序列,其中,所述图像序列包括至少一帧用户图像;根据所述图像序列,确定预设的唤醒条件是否满足;响应于确定所述唤醒条件满足,确定与所述唤醒条件对应的应答语音;播放所述应答语音。2.根据权利要求1所述的方法,其中,所述图像序列包括用户的眼部图像;以及所述根据所述图像序列,检测预设的唤醒条件是否满足,包括:对所述眼部图像进行分析,确定所述用户是否注视终端;响应于确定所述用户注视终端,确定所述唤醒条件满足。3.根据权利要求2所述的方法,其中,所述响应于确定所述唤醒条件满足,确定与所述唤醒条件对应的应答语音,包括:响应于确定所述唤醒条件满足,获取预设时长内的第一语音信息;对所述第一语音信息进行语义解析;根据语义解析结果,确定与所述唤醒条件对应的应答语音。4.根据权利要求1所述的方法,其中,所述图像序列包括用户的面部图像;以及所述根据所述图像序列,检测预设的唤醒条件是否满足,包括:对所述图像序列中的面部图像进行表情识别;根据表情识别结果,确定所述图像序列中相邻两帧图像对应的表情是否相同;响应于确定所述图像序列中相邻两帧图像对应的表情不同,确定所述唤醒条件满足。5.根据权利要求4所述的方法,其中,所述响应于确定所述唤醒条件满足,确定与所述唤醒条件对应的应答语音,包括:响应于确定所述唤醒条件满足,确定与相邻两帧图像中后一帧图像对应的表情对应的应答语音;将所确定的应答语音作为与所述唤醒条件对应的应答语音。6.根据权利要求1所述的方法,其中,所述图像序列包括用户的身体图像;以及所述根据所述图像序列,检测预设的唤醒条件是否满足,包括:对所述图像序列中的身体图像进行分析,确定用户的动作信息;响应于确定用户的动作信息满足预设条件,确定所述唤醒条件满足。7.根据权利要求6所述的方法,其中,所述响应于确定所述唤醒条件满足,确定与所述唤醒条件对应的应答语音,包括:确定与所述动作信息对应的应答语音作为与所述唤醒条件对应的应答语音。8.根据权利要求1所述的方法,其中,所述检测预设的唤醒条件是否满足,包括:响应于接收到服务端发送的应答语音,确定所述唤醒条件满足。9.根据权利要求1-8任一项所述的方法,其中,所述方法还包括:响应于所述应答语音的播放完成,获取预设时长内的第二语音信息;根据所述第二语音信息,控制所述终端。10.一种用于终端的交互装置,包括:图像序列获取单元,被配置成获取图像序列,其中,所述图像序列包括至少一帧用户图像;条件判断单元,被配置成根据所述图...

【专利技术属性】
技术研发人员:肖方董伟鑫马权
申请(专利权)人:三星电子中国研发中心三星电子株式会社
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1