语音识别控制方法、装置、电子设备和可读存储介质制造方法及图纸

技术编号:28116434 阅读:16 留言:0更新日期:2021-04-19 11:14
本申请公开了语音识别控制方法、装置、电子设备和可读存储介质,涉及人工智能和语音识别领域。具体实现方案为:探测到调用目标场景相关的应用程序接口,则查询第一工作状态的配置信息,以确定目标场景是否适用第一工作状态;若目标场景适用第一工作状态,将执行的第二工作状态切换为第一工作状态;其中,在第二工作状态下,根据唤醒词采集音频片段,对音频片段语音识别;在第一工作状态下,连续采集音频得到音频流,以对音频流语音识别。该方案中,用户可以根据自身需求,设置触发第一工作状态的场景,以满足不同用户的个性化需求,且只有在目标场景适用第一工作状态时,才控制设备进入第一工作状态,可以降低对用户的打扰,改善用户的使用体验。用户的使用体验。用户的使用体验。

【技术实现步骤摘要】
语音识别控制方法、装置、电子设备和可读存储介质


[0001]本申请涉及语音识别和人工智能
,尤其涉及一种语音识别控制方法、装置、电子设备和可读存储介质。

技术介绍

[0002]随着人工智能技术以及终端技术的不断发展,人工智能产品,比如智能音箱等电子设备不断普及,用户可以语音控制电子设备,以执行相应的控制指令。目前,当用户与电子设备之间需要连续语音交互时,即用户具有连续发起对话需求时,可以语音控制电子设备进入设定工作模式,以体验全双工免唤醒的功能。
[0003]然而,在一些场景下,用户可能并未具有连续发起对话需求,比如,用户与其他用户对话时,而无意触发了相应的控制指令,此时,电子设备进入设定工作模式可能会打扰到用户,严重降低了用户的使用体验。

技术实现思路

[0004]本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
[0005]本申请提出一种语音识别控制方法、装置、电子设备和可读存储介质,以实现由用户根据自身需求,设置触发第一工作状态的场景,以满足不同用户的个性化需求,并且,只有在目标场景适用第一工作状态时,才控制设备进入第一工作状态,可以降低对用户的打扰,改善用户的使用体验。
[0006]本申请第一方面实施例提出了一种语音识别控制方法,包括:
[0007]探测到调用目标场景相关的应用程序接口,则查询第一工作状态的配置信息,以确定所述目标场景是否适用第一工作状态;
[0008]若所述目标场景适用所述第一工作状态,将执行的第二工作状态切换为所述第一工作状态;其中,在所述第二工作状态下,根据唤醒词采集音频片段,对所述音频片段语音识别;
[0009]在所述第一工作状态下,连续采集音频得到音频流,以对所述音频流语音识别。
[0010]本申请第二方面实施例提出了一种语音识别控制装置,包括:
[0011]查询模块,用于探测到调用目标场景相关的应用程序接口,则查询第一工作状态的配置信息,以确定所述目标场景是否适用第一工作状态;
[0012]切换模块,用于若所述目标场景适用所述第一工作状态,将执行的第二工作状态切换为所述第一工作状态;其中,在所述第二工作状态下,根据唤醒词采集音频片段,对所述音频片段语音识别;
[0013]识别模块,用于在所述第一工作状态下,连续采集音频得到音频流,以对所述音频流语音识别。
[0014]本申请第三方面实施例提出了另一种语音识别控制方法,包括:
[0015]在目标场景下,查询第一工作状态的配置信息,以确定所述目标场景是否适用第
一工作状态;
[0016]若所述目标场景适用所述第一工作状态,将执行的第二工作状态切换为所述第一工作状态;其中,在所述第二工作状态下,根据唤醒词采集音频片段,对所述音频片段语音识别;
[0017]在所述第一工作状态下,连续采集音频得到音频流,以对所述音频流语音识别。
[0018]本申请第四方面实施例提出了另一种语音识别控制装置,包括:
[0019]查询模块,用于在目标场景下,查询第一工作状态的配置信息,以确定所述目标场景是否适用第一工作状态;
[0020]切换模块,用于若所述目标场景适用所述第一工作状态,将执行的第二工作状态切换为所述第一工作状态;其中,在所述第二工作状态下,根据唤醒词采集音频片段,对所述音频片段语音识别;
[0021]识别模块,用于在所述第一工作状态下,连续采集音频得到音频流,以对所述音频流语音识别。
[0022]本申请第五方面实施例提出了一种电子设备,包括:
[0023]至少一个处理器;以及
[0024]与所述至少一个处理器通信连接的存储器;其中,
[0025]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请第一方面实施例提出的语音识别控制方法,或者,执行本申请第三方面实施例提出的语音识别控制方法。
[0026]本申请第六方面实施例提出了一种计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请第一方面实施例提出的语音识别控制方法,或者,执行本申请第三方面实施例提出的语音识别控制方法。
[0027]上述申请中的一个实施例具有如下优点或有益效果:
[0028]通过探测到调用目标场景相关的应用程序接口,则查询第一工作状态的配置信息,以确定目标场景是否适用第一工作状态;若目标场景适用第一工作状态,将执行的第二工作状态切换为第一工作状态;其中,在第二工作状态下,根据唤醒词采集音频片段,对音频片段语音识别;在第一工作状态下,连续采集音频得到音频流,以对音频流语音识别。由此,用户可以根据自身需求,设置触发第一工作状态的场景,以满足不同用户的个性化需求,并且,只有在目标场景适用第一工作状态时,才控制设备进入第一工作状态,可以降低对用户的打扰,改善用户的使用体验。
[0029]上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
[0030]附图用于更好地理解本方案,不构成对本申请的限定,本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解。其中:
[0031]图1为本申请实施例一所提供的语音识别控制方法的流程示意图;
[0032]图2为本申请实施例中的配置界面示意图;
[0033]图3为本申请实施例二所提供的语音识别控制方法的流程示意图;
[0034]图4为本申请实施例三所提供的语音识别控制方法的流程示意图;
[0035]图5为本申请实施例四所提供的语音识别控制方法的流程示意图;
[0036]图6为本申请实施例五所提供的语音识别控制装置的结构示意图;
[0037]图7为本申请实施例六所提供的语音识别控制装置的结构示意图;
[0038]图8为本申请实施例七所提供的语音识别控制装置的结构示意图;
[0039]图9为本申请实施例八所提供的电子设备的结构示意图。
具体实施方式
[0040]以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0041]下面参考附图描述本申请实施例的语音识别控制方法、装置、电子设备和可读存储介质。
[0042]图1为本申请实施例一所提供的语音识别控制方法的流程示意图。
[0043]本申请实施例以该语音识别控制方法被配置于语音识别控制装置中来举例说明,该语音识别控制装置可以应用于任一电子设备中,以使该电子设备可以执行语音识别控制功能。
[0044]其中,电子设备可以为个人电脑(Personal Computer,简称PC)、云端设本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音识别控制方法,其特征在于,包括:探测到调用目标场景相关的应用程序接口,则查询第一工作状态的配置信息,以确定所述目标场景是否适用第一工作状态;若所述目标场景适用所述第一工作状态,将执行的第二工作状态切换为所述第一工作状态;其中,在所述第二工作状态下,根据唤醒词采集音频片段,对所述音频片段语音识别;在所述第一工作状态下,连续采集音频得到音频流,以对所述音频流语音识别。2.根据权利要求1所述的语音识别控制方法,其特征在于,所述将执行的第二工作状态切换为所述第一工作状态之前,还包括:在所述第二工作状态下,获取到对所述音频片段语音识别得到的第一控制意图;确定所述第一控制意图与所述目标场景匹配。3.根据权利要求1所述的语音识别控制方法,其特征在于,所述连续采集音频得到音频流,以对所述音频流语音识别之后,还包括:获取信息流;其中,所述信息流,是对所述音频流进行语音识别得到的;从所述信息流中获取各候选意图;从各候选意图中,筛选与所述目标场景的控制意图匹配的第二控制意图;若筛选得到所述第二控制意图,执行与所述第二控制意图对应的控制指令。4.根据权利要求3所述的语音识别控制方法,其特征在于,所述从各候选意图中,筛选与所述目标场景的控制意图匹配的第二控制意图之后,还包括:若在设定时长内,未得到所述第二控制意图,退出所述第一工作状态;其中,所述设定时长的取值范围为20秒至40秒。5.根据权利要求3所述的语音识别控制方法,其特征在于,所述从所述信息流中获取各候选意图之后,还包括:拒绝响应与所述目标场景的控制意图不匹配的候选意图。6.根据权利要求1-5任一项所述的语音识别控制方法,其特征在于,所述配置信息中包括适用所述第一工作状态的场景列表,所述场景列表是响应于用户选择操作,从音乐场景、有声读物场景和视频场景中选择生成的。7.一种语音识别装置,其特征在于,所述装置包括:查询模块,用于探测到调用目标场景相关的应用程序接口,则查询第一工作状态的配置信息,以确定所述目标场景是否适用第一工作状态;切换模块,用于若所述目标场景适用所述第一工作状态,将执行的第二工作状态切换为所述第一工作状态;其中,在所述第二工作状态下,根据唤醒词采集音频片段,对所述音频片段语音识别;识别模块,用于在所述第一工作状态下,连续采集音频得到音频流,以对所述音频流语音识别。8.根据权利要求7所述的语音识别控制装置,其特征在于,所述装置还包括:第一获取模块,用于在所述第二工作状态下,获取到对所述音频片段语音识别得到的第一控制意图;确定模块,用于确定所述第一控制意图与所述目标场景匹配...

【专利技术属性】
技术研发人员:罗咏曦王莎莎
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1