语音交互处理方法、装置和电子设备制造方法及图纸

技术编号:24712305 阅读:29 留言:0更新日期:2020-07-01 00:36
本申请公开了一种语音交互处理方法、装置和电子设备,涉及语音技术领域。具体实现方案为:通过接收语音数据,并将该语音数据和当前处于前台运行的目标应用程序对应的语音库进行匹配,其中,该语音库中包括多个与目标应用程序关联的控制命令;若匹配成功,则控制电子设备启动免唤醒功能,并执行与语音数据对应的操作。可以看出,本申请实施例中将接收到的语音数据和当前处于前台运行的目标应用程序对应的语音库进行匹配,若匹配成功,则该电子设备将不需要唤醒,直接执行与语音数据对应的操作,这样,电子设备可以及时为用户提供相应的服务,从而可以提高用户的体验。

【技术实现步骤摘要】
语音交互处理方法、装置和电子设备
本申请涉及数据
,尤其涉及语音

技术介绍
随着人工智能技术的不断发展,用户在日常生活中越来越多的通过语音交互方式从电子设备获得服务。目前,大多数电子设备都需要用户对其进行唤醒,在唤醒电子设备之后,用户才能正常发起语音查询(query)请求,即用户与电子设备进行对话。这种用户每次在发起语音查询请求之前,都必须唤醒电子设备的情况,造成用户体验感较差。基于此,现有技术中还提供一种免唤醒的方案:电子设备针对预设的一些免唤醒词采集大量的语料数据,并根据这些语料数据对初始唤醒模型进行不断训练,得到唤醒模型。这样,电子设备在获取到语音数据时,将获取的语音数据与训练得到的唤醒模型进行匹配,在匹配到预设的免唤醒词时,则唤醒电子设备。然而,上述的免唤醒方案中,由于预设的免唤醒词的数量有限,可能会造成在语音数据中不包括预设的免唤醒词时,电子设备无法及时提供相应的服务,造成用户体验不好。
技术实现思路
本申请实施例提供一种语音交互处理方法、装置和电子设备,可以使得电子设备能够及时为用户提供相应的服务,由此可以提高用户的体验。第一方面,本申请实施例提供一种语音交互处理方法,该语音交互处理方法可以包括:接收语音数据;将所述语音数据和当前处于前台运行的目标应用程序对应的语音库进行匹配,所述语音库中包括多个与所述目标应用程序关联的控制命令;若匹配成功,则控制电子设备启动免唤醒功能,并执行与所述语音数据对应的操作。可以看出,与现有技术不同的是,本申请实施例在将接收到的语音数据和当前处于前台运行的目标应用程序对应的语音库匹配成功之后,不需要唤醒电子设备,而是直接对语音数据进行识别,以执行与语音数据对应的操作,这样,不仅可以简化用户的操作,而且电子设备可以及时为用户提供相应的服务,由此可以提高用户的体验。第二方面,本申请实施例还提供一种语音交互处理装置,该装置包括:接收模块,用于接收语音数据;处理模块,用于将所述语音数据和当前处于前台运行的目标应用程序对应的语音库进行匹配,所述语音库中包括多个与所述目标应用程序关联的控制命令;所述处理模块,还用于在匹配成功时,控制所述语音交互处理装置启动免唤醒功能,并执行与所述语音数据对应的操作。第三方面,本申请实施例还提供一种电子设备,该电子设备可以包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述第一方面任一种可能的实现方式中所述的语音交互处理方法。第四方面,本申请实施例还提供一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行上述第一方面任一种可能的实现方式中所述的语音交互处理方法。上述申请中的一个实施例具有如下优点或有益效果:在接收到语音数据后,将语音数据和当前处于前台运行的目标应用程序对应的语音库进行匹配,该语音库中包括多个与目标应用程序关联的控制命令,若匹配成功,则控制电子设备启动免唤醒功能,并执行与语音数据对应的操作。因此,本申请实施例在将接收到的语音数据和当前处于前台运行的目标应用程序对应的语音库匹配成功之后,不需要唤醒电子设备,而是直接对语音数据进行识别,以执行与语音数据对应的操作,这样,不仅可以简化用户的操作,而且电子设备可以及时为用户提供相应的服务,由此可以提高用户的体验。另外,本申请实施例提供的方案,可以避免现有技术中需要采集大量的语料数据对初始唤醒模型进行不断训练,才能得到唤醒模型,由此可以降低语音处理的成本。上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1为本申请实施例提供的语音交互处理方法的一种应用场景示意图;图2是本申请实施例一提供的语音交互处理方法的流程示意图;图3是本申请实施例二提供的语音交互处理方法的流程示意图;图4为语音库进行更新的示意图;图5是本申请实施例三提供的语音交互处理方法的流程示意图;图6是本申请实施例提供的语音交互处理装置60的结构示意图;图7是用来实现本申请实施例的语音交互处理方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。在本申请的实施例中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况,其中A,B可以是单数或者复数。在本申请的文字描述中,字符“/”一般表示前后关联对象是一种“或”的关系。在本申请的实施例中,电子设备可以为支持信息通信,并能够对语音数据进行处理的各种电子设备,包括但不限于智能手机、平板电脑、便携式计算机和台式计算机等。为了通过语音交互方式从电子设备获得服务,首先需要将电子设备唤醒,但是这种方式造成用户的操作较为繁琐,使得用户的体验不好。基于此,目前还有一种方式是电子设备针对预设的一些免唤醒词采集大量的语料数据,并根据这些语料数据对初始唤醒模型进行不断训练,得到唤醒模型。这样,电子设备在获取到语音数据时,将获取的语音数据与训练得到的唤醒模型进行匹配,在匹配到预设的免唤醒词时,则唤醒电子设备。但是,由于预设的免唤醒词的数量是有限的,而且每个人想从电子设备中获得的相关服务可能会不一样,这样,就会造成用户在使用电子设备获得相关服务,且输入电子设备的语音数据中不包括上述预设的免唤醒词时,电子设备将无法及时提供相应的服务,从而造成用户的体验不好。为了使得电子设备能够根据用户的需求,及时为用户提供相应的服务,可以由用户自定义一些免唤醒词,也即用户根据自己的需求,在电子设备中预先存储一些免唤醒词,以达到电子设备免唤醒的目的。但是采用该方法,虽然在一定程度上可以提高电子设备在免唤醒的情况下,为用户提供相关服务的及时性,但是,由于电子设备能够提供的服务经常会发生变化,在电子设备提供的服务发生变化时,用户就需要重新设置一些免唤醒词,使得用户操作较为繁琐,导致用户体验不高。基于上述论述,为了使得电子设备能够及时为用户提供相应的服务,以提高用户的体验,本申请实施例提供了一种语音交互处理方法,在接收到语音数据后,将语音数据和当前处于前台运行的目标应用程序对应的语音库进行匹配,该语音库中包括多个与目标应用程序关联的控制命令,若匹配成功,则控制电子设备启动免唤醒功能,并执行与语音数据对应的操作。可以看出,与现有技术不同的是本文档来自技高网...

【技术保护点】
1.一种语音交互处理方法,其特征在于,包括:/n接收语音数据;/n将所述语音数据和当前处于前台运行的目标应用程序对应的语音库进行匹配,所述语音库中包括多个与所述目标应用程序关联的控制命令;/n若匹配成功,则控制电子设备启动免唤醒功能,并执行与所述语音数据对应的操作。/n

【技术特征摘要】
1.一种语音交互处理方法,其特征在于,包括:
接收语音数据;
将所述语音数据和当前处于前台运行的目标应用程序对应的语音库进行匹配,所述语音库中包括多个与所述目标应用程序关联的控制命令;
若匹配成功,则控制电子设备启动免唤醒功能,并执行与所述语音数据对应的操作。


2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若监测到所述目标应用程序关闭或者处于后台运行状态,则控制所述电子设备退出免唤醒功能。


3.根据权利要求1所述的方法,其特征在于,所述将所述语音数据和所述目标应用程序对应的语音库进行匹配之前,所述方法还包括:
建立所述目标应用程序对应的语音库。


4.根据权利要求1-3任一项所述的方法,其特征在于,所述方法还包括:
接收更新指令,所述更新指令中包括目标应用程序的标识信息和新的控制命令;
根据所述标识信息和所述新的控制命令,对所述目标应用程序的语音库进行更新。


5.根据权利要求1-3任一项所述的方法,其特征在于,将所述语音数据和当前处于前台运行的目标应用程序对应的语音库进行匹配,包括:
确定目标对象的朝向;
若所述目标对象朝向所述电子设备,则将所述语音数据和当前处于前台运行的目标应用程序对应的语音库进行匹配。


6.根据权利要求5所述的方法,其特征在于,所述若所述目标对象朝向所述电子设备,则将所述语音数据和当前处于前台运行的目标应用程序对应的语音库进行匹配,包括:
若所述目标对象朝向所述电子设备,则确定所述目标对象与所述电子设备之间的距离是否小于预设值;
若所述目标对象与所述电子设备之间的距离小于所述预设值,则将所述语音数据和当前处于前台运行的目标应用程序对应的语音库进行匹配。


7.根据权利要求1-3任一项所述的方法,其特征在于,所述控制电子设备启动免唤醒功能,包括:
控制所述电子设备关闭唤醒引擎,并打开识别引擎。


8.一种语音交互处理装置,其特征在于,包括:
接收模块,用于接收语音数据;
处理模块,用于将所述语音数据和当前处于前台运行的目标应用程序对应的语音库进行匹配,所述语音库...

【专利技术属性】
技术研发人员:何桂
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1