语音交互方法、装置、设备以及存储介质制造方法及图纸

技术编号:26602196 阅读:43 留言:0更新日期:2020-12-04 21:25
本申请公开了语音交互方法、装置、设备以及存储介质,涉及智能家居、人工智能领域。具体实现方案为:实时监测用户的语音;对语音进行识别,确定语音是否包括第一预设词语;响应于确定语音包括第一预设词语,确定语音中位于第一预设词语的下文信息是否包括第二预设词语;响应于确定第一预设词语的下文信息包括第二预设词语,对第二预设词语的下文信息进行意图识别;根据意图识别结果,对设备进行控制,以响应用户。本实现方式使得设备的交互过程变得适应性更强,用户感受更加友好。

【技术实现步骤摘要】
语音交互方法、装置、设备以及存储介质
本申请涉及计算机
,具体涉及智能家居、人工智能领域,尤其涉及语音交互方法、装置、设备以及存储介质。
技术介绍
随着人工智能技术的不断发展,基于语音唤醒的终端设备控制系统也在不断发展,其中,语音唤醒作为控制终端设备的入口,逐渐成为人工智能
的研究热点。目前,用户可以通过语音唤醒终端设备并控制终端设备执行相应操作,带来了很多便利。然而,由于不同的用户的唤醒习惯不同,如何使终端设备适应不同的唤醒习惯是待解决的问题。
技术实现思路
提供了一种语音交互方法、装置、设备以及存储介质。根据第一方面,提供了一种语音交互方法,包括:实时监测用户的语音;对语音进行识别,确定语音是否包括第一预设词语;响应于确定语音包括第一预设词语,确定语音中位于第一预设词语的下文信息是否包括第二预设词语;响应于确定第一预设词语的下文信息包括第二预设词语,对第二预设词语的下文信息进行意图识别;根据意图识别结果,控制设备响应用户。根据第二方面,提供了一种语音交互装置,包括:实时监测单元,被配置成实时监测用户的语音;语音识别单元,被配置成对语音进行识别,确定语音是否包括第一预设词语;判断单元,被配置成响应于确定语音包括第一预设词语,确定语音中位于第一预设词语的下文信息是否包括第二预设词语;意图识别单元,被配置成响应于确定第一预设词语的下文信息包括第二预设词语,对第二预设词语的下文信息进行意图识别;设备控制单元,被配置成根据意图识别结果,控制设备响应用户。根据第三方面,提供了一种语音交互电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面所描述的方法。根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,上述计算机指令用于使计算机执行如第一方面所描述的方法。根据本申请的技术解决了现有的终端设备唤醒方法不能很好的适应不同用户的唤醒习惯的技术问题,使得设备的交互过程变得适应性更强,用户感受更加友好。应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是本申请的一个实施例可以应用于其中的示例性系统架构图;图2是根据本申请的语音交互方法的一个实施例的流程图;图3是根据本申请的语音交互方法的一个应用场景的示意图;图4是根据本申请的语音交互方法的另一个实施例的流程图;图5是根据本申请的语音交互装置的一个实施例的结构示意图;图6是用来实现本申请实施例的语音交互方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请的语音交互方法或语音交互装置的实施例的示例性系统架构100。如图1所示,系统架构100可以包括智能终端设备101、102、103,网络104和服务器105。网络104用以在智能终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。用户可以使用智能终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。智能终端设备101、102、103上可以安装有各种通讯客户端应用,例如语音识别类应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。智能终端设备101、102、103可以是硬件,也可以是软件。当智能终端设备101、102、103为硬件时,可以是具有语音识别功能的各种电子设备,包括但不限于智能手机、智能音箱、智能机器人等等。当智能终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。服务器105可以是提供各种服务的服务器,例如对智能终端设备101、102、103获取到的语音进行处理的后台服务器。后台服务器可以对语音等数据进行分析等处理,并将处理结果(例如响应数据)反馈给智能终端设备101、102、103。需要说明的是,服务器105可以是硬件,也可以是软件。当服务器105为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器105为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。需要说明的是,本申请实施例所提供的语音交互方法一般由智能终端设备101、102、103执行。相应地,语音交互装置一般设置于智能终端设备101、102、103中。应该理解,图1中的智能终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的智能终端设备、网络和服务器。继续参考图2,示出了根据本申请的语音交互方法的一个实施例的流程200。本实施例的语音交互方法,包括以下步骤:步骤201,实时监测用户的语音。本实施例中,语音交互方法的执行主体(例如图1所示的智能终端设备101、102、103)可以实时监测用户的语音。具体的,执行主体上可以安装有麦克风阵列,用于实时采集用户的语音,并对语音进行分析。步骤202,对语音进行识别,确定语音是否包括第一预设词语。执行主体在采集到用户的语音后,可以对语音进行识别,确定语音是否包括第一预设词语。具体的,执行主体可以对语音进行语音识别,得到语音对应的文字。然后,确定文字中是否包括第一预设词语。这里,第一预设词语可以为智能终端设备的唤醒词的一部分,例如可以是唤醒词的前两个字。举例来说,唤醒词为小A小A,第一预设词语可以为小A。步骤203,响应于确定语音包括第一预设词语,确定语音中位于第一预设词语的下文信息是否包括第二预设词语。本实施例中,如果语音中包括第一预设词语,则执行主体可以判断语音中位于第一预设词语的下文信息是否包括第二预设词语。这里,第二预设词语可以为唤醒词的另一部分,例如可以是唤醒词的后两个字。可以理解的是,第一预设词语和第二预设词语可以相同,也可以不相同。步骤204,响应于确定第一预设词语的下文信息包括第二预设词语,对第二预设词语的下文信息进行意图识别。如果本文档来自技高网...

【技术保护点】
1.一种语音交互方法,包括:/n实时监测用户的语音;/n对所述语音进行识别,确定所述语音是否包括第一预设词语;/n响应于确定所述语音包括第一预设词语,确定所述语音中位于所述第一预设词语的下文信息是否包括第二预设词语;/n响应于确定所述第一预设词语的下文信息包括第二预设词语,对所述第二预设词语的下文信息进行意图识别;/n根据意图识别结果,控制设备响应所述用户。/n

【技术特征摘要】
1.一种语音交互方法,包括:
实时监测用户的语音;
对所述语音进行识别,确定所述语音是否包括第一预设词语;
响应于确定所述语音包括第一预设词语,确定所述语音中位于所述第一预设词语的下文信息是否包括第二预设词语;
响应于确定所述第一预设词语的下文信息包括第二预设词语,对所述第二预设词语的下文信息进行意图识别;
根据意图识别结果,控制设备响应所述用户。


2.根据权利要求1所述的方法,其中,所述方法还包括:
响应于确定所述第一预设词语的下文信息不包括第二预设词语,对所述第一预设词语的下文信息进行意图识别。


3.根据权利要求2所述的方法,其中,所述方法还包括:
根据所述语音,确定所述用户与所述设备的交互习惯;
根据所述交互习惯,输出响应信息。


4.根据权利要求3所述的方法,其中,所述根据所述语音,确定所述用户对所述设备的交互习惯,包括:
响应于确定所述第一预设词语的下文信息包括所述第二预设词语,确定所述第一预设词语和所述第二预设词语的组合为所述用户对所述设备的常用唤醒词。


5.根据权利要求3所述的方法,其中,所述根据所述语音,确定所述用户对所述设备的交互习惯,包括:
响应于确定所述第一预设词语的下文信息不包括第二预设词语,确定所述第一预设词语为所述用户对所述设备的常用唤醒词。


6.根据权利要求4或5所述的方法,其中,所述根据所述语音,确定所述用户对所述设备的交互习惯,包括:
根据所述语音,确定在所述常用唤醒词之后的停顿时间。


7.一种语音交互装置,包括:
实时监测单元,被配置成实时监测用户的语音;
语音识别单元,被配置成语音识别单元,被配置成对所述语音进行识别,确定所述语音是否包括第一预设词语;
判断单元,被配置成响应于确定所述语音包括第一预设词语,确定所述语音中位...

【专利技术属性】
技术研发人员:金鹿黄荣升张刚薛军涛朱凯华
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1