一种语音指令处理方法、装置、系统以及存储介质制造方法及图纸

技术编号：40015234 阅读：8 留言：0更新日期：2024-01-16 15:54

一种语音指令处理方法、装置、系统以及存储介质。该方法包括：语音助手获取第一语音指令；确定所述第一语音指令的意图，并根据所述第一语音指令的意图确定所述第一语音指令缺失槽位；获取历史语音指令集合中的第二语音指令，所述第二语音指令与所述第一语音指令相关；根据所述第二语音指令的槽位确定所述第一语音指令的槽位。采用上述方法可以在语音指令语义缺失的情况下，确定该语音指令的完整语义，从而可以使得该语音指令能够被执行。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及语音控制，尤其涉及一种语音指令处理方法、装置、系统以及存储介质。

技术介绍

1、随着信息技术的飞速发展，语音控制作为人机交互的一种形式应用得越来越广泛。

2、目前，语音控制通常是通过语音助手实现的，用户可以通过语音助手输入语音指令，然后语音助手根据用户输入的语音指令控制电子设备执行与语音指令相对应的操作。尤其在智能家居领域，语音助手可以作为智能家居的控制端口，直接通过语音对话，自动控制智能设备，方便用户对各种设备的使用。

3、当前的语音助手对语音指令的处理缺乏多轮接续的能力，要求用户每次输入的语音指令提供完整信息，比如需要包括意图和槽位，若用户输入的语音指令语义不完整，比如缺少执行设备，则语音助手无法理解该语音指令，该语音指令无法被执行。

技术实现思路

1、本申请实施例提供一种语音指令处理方法、装置、系统以及存储介质，用以在语音指令语义缺失的情况下，确定该语音指令的完整语义，从而可以使得该语音指令能够被执行。

2、第一方面，提供一种语音指令处理方法，该方法可以由语音助手执行。所述方法包括：获取第一语音指令，确定所述第一语音指令的意图，并根据所述第一语音指令的意图确定所述第一语音指令缺失槽位；获取历史语音指令集合中的第二语音指令，所述第二语音指令与所述第一语音指令相关；根据所述第二语音指令的槽位确定所述第一语音指令的槽位。

3、上述实现方式中，在第一语音指令缺失槽位(比如意图的执行者，更具体地，比如执行设备、应用或服务等)的情

4、在一种可能的实现方式中，所述根据所述第二语音指令的槽位确定所述第一语音指令的槽位包括：所述第一语音指令缺失的槽位由所述第二语音指令对应的槽位提供。

5、在一种可能的是实现方式中，所述根据所述第二语音指令的槽位确定所述第一语音指令的槽位之后，所述方法还包括：将所述第二语音指令的槽位添加到所述第一语音指令中，将添加有所述槽位的第一语音指令存储到所述历史语音指令集合中。

6、上述实现方式中，将补充完整的第一语音指令存储到历史语音指令集合中，可以为后续的语音处理操作提供依据。可选的，可以在第一语音指令执行成功后，将该第一语音指令存储到历史语音指令集合中。

7、可选的，所述将所述第二语音指令的槽位添加到所述第一语音指令中，包括：获取所述第二语音指令的结构化数据中的槽位，所述第二语音指令的结构化数据中的槽位为自然语言表述的槽位信息或为协议参数，所述协议参数为对所述自然语言表述的槽位信息进行映射后得到的协议参数；将所述第二语音指令的结构化数据中的槽位，添加到所述第一语音指令的结构化数据中。

8、可选的，所述方法还包括：若所述第一语音指令中包括用于指示所述第一语音指令的槽位的指示代词，则将所述指示代词从所述第一语音指令中删除。

9、在将第一语音指令补充完整后，将其中用于指示槽位的指示代词删除，可以使得该语音指令的语义更清楚。

10、在一种可能的实现方式中，所述获取历史语音指令集合中的第二语音指令，包括：根据所述第一语音指令与历史语音指令集合中的历史语音指令的相关度，获取所述历史语音指令集合中与所述第一语音指令相关的第二语音指令。

11、可选的，所述根据所述第一语音指令与历史语音指令集合中的历史语音指令的相关度，获取所述历史语音指令集合中与所述第一语音指令相关的第二语音指令，包括：根据所述第一语音指令、所述第一语音指令的意图和/或所述第一语音指令对应的关联信息，以及所述历史语音指令集合中各历史语音指令、各历史语音指令的意图和/或对应的关联信息，确定所述第一语音指令与所述历史语音指令集合中各历史语音指令的相关度；其中，所述第一语音指令对应的关联信息是在接收到所述第一语音指令时收集的，所述历史语音指令对应的关联信息是在接收到所述历史语音指令时收集的；根据所述第一语音指令与所述历史语音指令集合中各历史语音指令的相关度，从所述历史语音指令集合中选取与所述第一语音指令相关的第二语音指令。

12、上述实现方式中，根据语音指令对应的关联信息进行语音指令的匹配操作，可以使得匹配结果(即匹配到的第二语音指令)更加准确。

13、在一种可能的实现方式中，所述获取历史语音指令集合中的第二语音指令，包括：第一电子设备向云端或第三电子设备发送第一请求消息，所述第一请求消息用于请求获取所述历史语音指令集合中与所述第一语音指令关联的语音指令；其中，所述第一电子设备为所述第一语音指令的接收设备；所述第一电子设备接收所述云端或所述第三电子设备发送的第一响应消息，所述第一响应消息中携带有所述第二语音指令，所述第二语音指令是根据所述第一语音指令与历史语音指令集合中的历史语音指令的相关度，从所述历史语音指令集合中获取到的。

14、可选的，所述第一请求消息携带所述第一语音指令、第一语音指令的意图和/或所述第一语音指令对应的关联信息。

15、可选的，所述第一语音指令对应的关联信息，包括以下至少一项：

16、设备信息，所述设备信息为所述第一语音指令的接收设备的信息；

17、用户账户信息，所述用户账户信息为登录语音助手的用户账户信息；

18、位置信息，所述位置信息为所述第一语音指令的接收设备的位置信息；

19、时间信息，所述时间信息包括所述第一语音指令的接收时间，和/或，所述第一语音指令与前一个接收到的语音指令之间的时间间隔；

20、用户身份信息，所述用户身份信息与所述第一语音指令的音频数据的特征信息相关联。

21、上述实现方式中，语音指令对应的关联信息可以包括多个不同维度的信息，从而提高匹配的准确性。

22、在一种可能的实现方式中，所述获取历史语音指令集合中的第二语音指令，以及所述根据所述第二语音指令的槽位确定所述第一语音指令的槽位，包括：云端根据所述第一语音指令与历史语音指令集合中的历史语音指令的相关度，获取所述历史语音指令集合中与所述第一语音指令相关的第二语音指令；根据所述第二语音指令的槽位确定所述第一语音指令的槽位，所述第一语音指令缺失的槽位由所述第二语音指令对应的槽位提供。

23、在一种可能的实现方式中，所述获取第一语音指令，包括：云端对来自第一电子设备的所述第一语音指令的音频数据进行转换，得到对应的文本数据；所述确定所述第一语音指令的意图，并根据所述第一语音指令的意图确定所述第一语音指令缺失槽位，包括：所述云端对所述文本数据进行解析，得到所述第一语音指令的意图，并根据所述第一语音指令的意图确定所述第一语音指令缺失槽位；所述获取历史语音指令集合中的第二语音指令，以及所述根据所述第二语音指令的槽位确定所述第一语音指令的槽位，包括：所述云端获取历史语音指令集合中的第二语音指令，并根据所述第二语音本文档来自技高网...

【技术保护点】

1.一种语音指令处理方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，所述根据所述第二语音指令的槽位确定所述第一语音指令的槽位包括：

3.如权利要求1或2所述的方法，其特征在于，所述根据所述第二语音指令的槽位确定所述第一语音指令的槽位之后，所述方法还包括：

4.如权利要求3所述的方法，其特征在于，所述将所述第二语音指令的槽位添加到所述第一语音指令中，包括：

5.如权利要求3或4所述的方法，其特征在于，所述方法还包括：

6.如权利要求1-5任一项所述的方法，其特征在于，所述获取历史语音指令集合中的第二语音指令，包括：

7.如权利要求6所述的方法，其特征在于，所述根据所述第一语音指令与历史语音指令集合中的历史语音指令的相关度，获取所述历史语音指令集合中与所述第一语音指令相关的第二语音指令，包括：

8.如权利要求1-5任一项所述的方法，其特征在于，所述获取历史语音指令集合中的第二语音指令，包括：

9.如权利要求8所述的方法，其特征在于，所述第一请求消息携带所述第一语音

10.如权利要求7或9所述的方法，其特征在于，所述第一语音指令对应的关联信息，包括以下至少一项：

11.如权利要求1-5任一项所述的方法，其特征在于，所述获取历史语音指令集合中的第二语音指令，以及所述根据所述第二语音指令的槽位确定所述第一语音指令的槽位，包括：

12.如权利要求1-5任一项所述的方法，其特征在于：

13.如权利要求1-12任一项所述的方法，其特征在于，所述历史语音指令集合中包括历史语音指令的结构化数据，所述历史语音指令的结构化数据包括意图和槽位。

14.如权利要求1-13任一项所述的方法，其特征在于，所述槽位为执行语音指令的意图的设备或应用或服务。

15.一种语音指令处理系统，其特征在于，包括：

16.如权利要求15所述的系统，其特征在于，所述第一语音指令缺失的槽位由所述第二语音指令对应的槽位提供。

17.如权利要求15或16所述的系统，其特征在于，所述处理模块，还用于：

18.如权利要求17所述的系统，其特征在于，所述处理模块，具体用于：

19.如权利要求17或18所述的系统，其特征在于，所述处理模块，还用于：

20.如权利要求15-19任一项所述的系统，其特征在于，所述处理模块，具体用于：

21.如权利要求20所述的系统，其特征在于，所述处理模块，具体用于：

22.如权利要求21所述的系统，其特征在于，所述第一语音指令对应的关联信息，包括以下至少一项：

23.如权利要求15-22任一项所述的系统，其特征在于，所述历史语音指令集合中包括历史语音指令的结构化数据，所述历史语音指令的结构化数据包括意图和槽位。

24.如权利要求15-23任一项所述的系统，其特征在于，所述槽位为执行语音指令的意图的设备或应用或服务。

25.如权利要求15-24任一项所述的系统，其特征在于：

26.如权利要求15-25任一项所述的系统，其特征在于，还包括：

27.如权利要求26所述的系统，其特征在于，还包括：自然语言生成模块、文本转语音模块；

28.一种电子设备，其特征在于，包括：一个或多个处理器；所述一个或多个存储器存储有一个或多个计算机程序，所述一个或多个计算机程序包括指令，当所述指令被所述一个或多个处理器执行时，使得所述电子设备执行如权利要求1-14中任意一项所述的方法。

29.一种计算机可读存储介质，其特征在于，包括计算机程序，当所述计算机程序在电子设备上运行时，使得所述电子设备执行如权利要求1-14中任意一项所述的方法。

...

【技术特征摘要】

1.一种语音指令处理方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，所述根据所述第二语音指令的槽位确定所述第一语音指令的槽位包括：

3.如权利要求1或2所述的方法，其特征在于，所述根据所述第二语音指令的槽位确定所述第一语音指令的槽位之后，所述方法还包括：

4.如权利要求3所述的方法，其特征在于，所述将所述第二语音指令的槽位添加到所述第一语音指令中，包括：

5.如权利要求3或4所述的方法，其特征在于，所述方法还包括：

6.如权利要求1-5任一项所述的方法，其特征在于，所述获取历史语音指令集合中的第二语音指令，包括：

8.如权利要求1-5任一项所述的方法，其特征在于，所述获取历史语音指令集合中的第二语音指令，包括：

9.如权利要求8所述的方法，其特征在于，所述第一请求消息携带所述第一语音指令、第一语音指令的意图和/或所述第一语音指令对应的关联信息。

10.如权利要求7或9所述的方法，其特征在于，所述第一语音指令对应的关联信息，包括以下至少一项：

12.如权利要求1-5任一项所述的方法，其特征在于：

14.如权利要求1-13任一项所述的方法，其特征在于，所述槽位为执行语音指令的意图的设备或应...

【专利技术属性】
技术研发人员：张亚兵，韩骁枫，张田，陈开济，许坤，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人