语音识别控制方法、装置、电子设备和可读存储介质制造方法及图纸

技术编号：28116434 阅读：16 留言：0更新日期：2021-04-19 11:14

本申请公开了语音识别控制方法、装置、电子设备和可读存储介质，涉及人工智能和语音识别领域。具体实现方案为：探测到调用目标场景相关的应用程序接口，则查询第一工作状态的配置信息，以确定目标场景是否适用第一工作状态；若目标场景适用第一工作状态，将执行的第二工作状态切换为第一工作状态；其中，在第二工作状态下，根据唤醒词采集音频片段，对音频片段语音识别；在第一工作状态下，连续采集音频得到音频流，以对音频流语音识别。该方案中，用户可以根据自身需求，设置触发第一工作状态的场景，以满足不同用户的个性化需求，且只有在目标场景适用第一工作状态时，才控制设备进入第一工作状态，可以降低对用户的打扰，改善用户的使用体验。用户的使用体验。用户的使用体验。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别控制方法、装置、电子设备和可读存储介质

[0001]本申请涉及语音识别和人工智能
，尤其涉及一种语音识别控制方法、装置、电子设备和可读存储介质。

技术介绍

[0002]随着人工智能技术以及终端技术的不断发展，人工智能产品，比如智能音箱等电子设备不断普及，用户可以语音控制电子设备，以执行相应的控制指令。目前，当用户与电子设备之间需要连续语音交互时，即用户具有连续发起对话需求时，可以语音控制电子设备进入设定工作模式，以体验全双工免唤醒的功能。
[0003]然而，在一些场景下，用户可能并未具有连续发起对话需求，比如，用户与其他用户对话时，而无意触发了相应的控制指令，此时，电子设备进入设定工作模式可能会打扰到用户，严重降低了用户的使用体验。

技术实现思路

[0004]本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
[0005]本申请提出一种语音识别控制方法、装置、电子设备和可读存储介质，以实现由用户根据自身需求，设置触发第一工作状态的场景，以满足不同用户的个性化需求，并且，只有在目标场景适用第一工作状态时，才控制设备进入第一工作状态，可以降低对用户的打扰，改善用户的使用体验。
[0006]本申请第一方面实施例提出了一种语音识别控制方法，包括：
[0007]探测到调用目标场景相关的应用程序接口，则查询第一工作状态的配置信息，以确定所述目标场景是否适用第一工作状态；
[0008]若所述目标场景适用所述第一工作状态，将执行的第二工作状态切换为所述第一工...

【技术保护点】

【技术特征摘要】
1.一种语音识别控制方法，其特征在于，包括：探测到调用目标场景相关的应用程序接口，则查询第一工作状态的配置信息，以确定所述目标场景是否适用第一工作状态；若所述目标场景适用所述第一工作状态，将执行的第二工作状态切换为所述第一工作状态；其中，在所述第二工作状态下，根据唤醒词采集音频片段，对所述音频片段语音识别；在所述第一工作状态下，连续采集音频得到音频流，以对所述音频流语音识别。2.根据权利要求1所述的语音识别控制方法，其特征在于，所述将执行的第二工作状态切换为所述第一工作状态之前，还包括：在所述第二工作状态下，获取到对所述音频片段语音识别得到的第一控制意图；确定所述第一控制意图与所述目标场景匹配。3.根据权利要求1所述的语音识别控制方法，其特征在于，所述连续采集音频得到音频流，以对所述音频流语音识别之后，还包括：获取信息流；其中，所述信息流，是对所述音频流进行语音识别得到的；从所述信息流中获取各候选意图；从各候选意图中，筛选与所述目标场景的控制意图匹配的第二控制意图；若筛选得到所述第二控制意图，执行与所述第二控制意图对应的控制指令。4.根据权利要求3所述的语音识别控制方法，其特征在于，所述从各候选意图中，筛选与所述目标场景的控制意图匹配的第二控制意图之后，还包括：若在设定时长内，未得到所述第二控制意图，退出所述第一工作状态；其中，所述设定时长的取值范围为20秒至40秒。5.根据权利要求3所述的语音识别控制方法，其特征在于，所述从所述信息流中获取各候选意图之后，还包括：拒绝响应与所述目标场景的控制意图不匹配的候选意图。6.根据权利要求1-5任一项所述的语音识别控制方法，其特征在于，所述配置信息中包括适用所述第一工作状态的场景列表，所述场景列表是响应于用户选择操作，从音乐场景、有声读物场景和视频场景中选择生成的。7.一种语音识别装置，其特征在于，所述装置包括：查询模块，用于探测到调用目标场景相关的应用程序接口，则查询第一工作状态的配置信息，以确定所述目标场景是否适用第一工作状态；切换模块，用于若所述目标场景适用所述第一工作状态，将执行的第二工作状态切换为所述第一工作状态；其中，在所述第二工作状态下，根据唤醒词采集音频片段，对所述音频片段语音识别；识别模块，用于在所述第一工作状态下，连续采集音频得到音频流，以对所述音频流语音识别。8.根据权利要求7所述的语音识别控制装置，其特征在于，所述装置还包括：第一获取模块，用于在所述第二工作状态下，获取到对所述音频片段语音识别得到的第一控制意图；确定模块，用于确定所述第一控制意图与所述目标场景匹配...

【专利技术属性】
技术研发人员：罗咏曦，王莎莎，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人