System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 语音交互方法及相关装置制造方法及图纸_技高网

语音交互方法及相关装置制造方法及图纸

技术编号:39984828 阅读:9 留言:0更新日期:2024-01-09 01:48
本申请提供语音交互方法及相关装置。电子设备在语音助手未被唤醒时可以识别检测到的语音是否与预设的意图匹配。若匹配,电子设备可以执行该语音匹配的意图对应的操作,并唤醒语音助手。电子设备唤醒语音助手后可以更准确地响应用户后续的请求。其中,若语音助手唤醒后的预设时间段内无语音交互,电子设备可以将语音助手从唤醒态切换到睡眠态。在上述方法中,电子设备可以在语音助手处于睡眠态时快速响应用户的请求。用户可以无需无需唤醒语音助手,随时下达语音指令指示电子设备执行相应的操作。

【技术实现步骤摘要】

本申请涉及终端,尤其涉及语音交互方法及相关装置


技术介绍

1、目前越来越多的设备可以提供语音交互功能,方便用户通过语音来控制设备。例如,用户可以向设备下达语音指令“播放音乐”。设备可以在识别出该语音指令后,播放音乐。但用户每次向设备下达语音指令时,都需要先通过唤醒词唤醒设备中的语音交互应用,然后再说出语音指令。这就导致用户与设备进行语音交互的过程不流畅,用户需要频繁说唤醒词来实现语音控制设备的目的,用户体验较差。


技术实现思路

1、本申请提供语音交互方法及相关装置。上述方法可以在节约电子设备功耗的基础上,给用户带来全时免唤醒的语音交互体验。用户可以无需唤醒语音助手,随时下达语音指令指示电子设备执行相应的操作。

2、第一方面,本申请提供一种语音交互方法。该方法应用于电子设备。电子设备包含语音助手。其中,电子设备可以在语音助手处于睡眠态的情况下,接收第一语音。电子设备可以确定第一语音与第一列表中的第一意图匹配,第一列表中包含一个或多个语音指令对应的意图。电子设备可以执行第一意图对应的操作。电子设备可以唤醒语音助手。在语音助手处于唤醒态的情况下,电子设备可以接收第二语音。电子设备可以识别第二语音中的第二意图,执行第二意图对应的操作。

3、由上述方法可知,在未唤醒语音助手的情况下,电子设备可以实时检测用户说出的语音是否与第一列表中的意图匹配。当检测到用户说出的语音与第一列表中的意图匹配,电子设备可以直接执行该意图对应的操作。其中,第一列表包含与语音指令对应的意图。也即是说,用户可以直接向电子设备下达与第一列表中的意图对应的语音指令,而无需先唤醒语音助手。且在下达语音指令后,电子设备除了执行该语音指令对应的操作,还可以唤醒语音助手。这样,用户还可以进一步向电子设备下达更多的语音指令,从而在不进行唤醒操作的情况下与电子设备进行多轮语音交互。

4、结合第一方面,在一些实施例中,上述第一列表可以是本申请中的执行意图列表。第一列表中包含的意图可以称为执行意图。第一列表可包含用户常用语音指令对应的意图。上述常用语音指令可以包括使用频率高、误识率低、没有歧义的语音指令。上述误识率可以指将用户说出的不包含语音指令的语音误识别为语音指令的概率。这样可以方便用户在不进行唤醒操作的情况下,直接下达常用语音指令来控制电子设备执行相应的操作。

5、结合第一方面,在一些实施例中,第一语音和第二语音均不包含用于唤醒语音助手的唤醒词。

6、结合第一方面,在一些实施例中,电子设备可包含第一语音识别模型和第二语音识别模型。其中,第二语音识别模型的大小大于第一语音识别模型的大小。上述第一语音识别模型的大小和第二语音识别模型的大小可以指语音识别模型所需要的存储空间的大小。语音识别模型的大小越大,可以表示语音识别模型的算力越高。算力可以表示语音识别模型处理、运算数据的能力。即第二语音识别模型的算力高于第一语音识别模型的大小。语音识别模型的算力越低,语音识别模型的功耗越低,所需的计算资源越少。也即是说,在同样的运行条件下,第二语音识别模型的功耗高于第一语音识别模型的功耗。第二语音识别模型所需的计算资源多于第一语音识别模型所需的计算资源。其中,语音识别模型的算力越低,语音识别模型所使用的参数量可能更少。即第二语音识别模型所使用的参数量多于第一语音识别模型所使用的参数量。

7、在语音助手处于睡眠态的情况下,电子设备可以实时运行第一语音识别模型。其中,电子设备可以利用第一语音识别模型确定第一语音与第一列表中的第一意图匹配。

8、当唤醒语音助手,在语音助手处于唤醒态的情况下,电子设备可以运行第二语音识别模型。其中,电子设备可以利用第二语音识别模型识别第二语音中的第二意图。电子设备利用第二语音识别模型识别接收到的语音中的意图时,无需使用上述第一列表。

9、由于第一语音识别模型的功耗低,电子设备在未唤醒语音助手的情况下实时运行低算力语音识别模型通常不会产生过高的功耗,从而也不会导致电子设备发热、运行卡顿等问题。电子设备在语音助手未被唤醒时持续运行低算力语音识别模型,可以实现用尽可能少的功耗,给用户带来全时免唤醒的体验。当识别出检测到的语音与第一意图匹配,电子设备除了执行第一意图对应的操作,还可以唤醒语音助手。这样,电子设备在语音助手唤醒后可以更加准确地是识别用户后续的请求,给用户提供更好的语音交互体验。

10、结合第一方面,在一些实施例中,唤醒语音助手之后,电子设备还可以在第一时间段内未接收到语音的情况下,将语音助手从唤醒态切换到睡眠态。

11、其中,上述第一时间段可以是以语音助手处于唤醒态时,电子设备最后一次接收到语音的时刻为起始时刻,时长为预设时长(如5秒、10秒等等)的一段时间。或者,上述第一时间段可以是以语音助手处于唤醒态时,电子设备最后一次从接收到的语音中识别出语音指令的时刻为起始时刻,时长为预设时长的一段时间。或者,上述第一时间段可以是以语音助手处于唤醒态时,电子设备最后一次响应接收到的语音指令执行相应操作的时刻为起始时刻,时长为预设时长的一段时间。

12、例如,电子设备在接收到上述第二语音之后的一段时间内未检测到环境中有语音。那么,上述第一时间段可以是以电子设备接收到第二语音的时刻为起始时刻,时长为预设时长的一段时间。再例如,电子设备在执行上述第二语音中的第二意图对应的操作后未检测到环境中有语音。那么,上述第一时间段可以是以电子设备执行完成第二意图对应的操作的时刻为起始时刻,时长为预设时长的一段时间。

13、上述实施例可以避免用户在语音助手被唤醒后没有下达语音指令的情况下,电子设备长时间运行高算力语音识别模型功耗过高,从而节约电子设备的功耗。

14、结合第一方面,在一些实施例中,第一列表对应第一句式列表和第一实体列表,第一句式列表包含一个或多个句式,第一实体列表包含一个或多个实体,第一列表中的一个或多个意图由第一句式列表中的句式与第一实体列表中的实体组成。电子设备可以在语音助手处于睡眠态的情况下,接收第三语音。电子设备可以确定第三语音的句式与第一句式列表中的第一句式匹配,且第一实体列表中没有与第三语音的第一实体匹配的实体。电子设备可以唤醒语音助手。在语音助手处于唤醒态的情况下,电子设备可以识别第三语音中的第三意图,并执行第三意图对应的操作,第三意图由第一句式和第一实体组成。

15、其中,第一列表中的意图可以根据意图中有无实体划分为有实体意图和无实体意图。实体可以指一种事物类别下的具体实例。例如,实体对应的事物类别可以包括以下一项或多项:歌名、歌手名、地点名、电影名、电视剧名、图书名、火车车次、航班号、电话号码、邮箱等等。上述实体对应的事物类别也可称为实体类别。有实体意图即为包含实体的意图。其中,有实体意图可以由句式和实体组成。句式可以包含句式主体结构和实体占位符。实体占位符用于确定句式中用于放置实体的位置。有实体意图的句式可以支持在实体占位符所在的位置放置同一种事物类别下的任意实体。无实体意本文档来自技高网...

【技术保护点】

1.一种语音交互方法,所述方法应用于电子设备,其特征在于,所述电子设备包含语音助手,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述第一语音和所述第二语音均不包含用于唤醒所述语音助手的唤醒词。

3.根据权利要求1或2所述的方法,其特征在于,所述确定所述第一语音与第一列表中的第一意图匹配,具体包括:

4.根据权利要求1-3中任一项所述的方法,其特征在于,所述唤醒所述语音助手之后,所述方法还包括:

5.根据权利要求1-4中任一项所述的方法,其特征在于,所述第一列表对应第一句式列表和第一实体列表,所述第一句式列表包含一个或多个句式,所述第一实体列表包含一个或多个实体,所述第一列表中的一个或多个意图由所述第一句式列表中的句式与所述第一实体列表中的实体组成;所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,所述方法还包括:

7.根据权利要求6所述的方法,其特征在于,所述方法还包括:

8.根据权利要求1-7中任一项所述的方法,其特征在于,所述方法还包括:

9.根据权利要求8所述的方法,其特征在于,所述提供第一提示之后,所述方法还包括:

10.根据权利要求8所述的方法,其特征在于,所述提供第一提示之后,所述方法还包括:

11.根据权利要求8-10中任一项所述的方法,其特征在于,所述提供第一提示,具体包括:

12.根据权利要求8-11中任一项所述的方法,其特征在于,所述第一列表包括第六意图,所述方法还包括:

13.一种语音交互方法,所述方法应用于电子设备,其特征在于,所述电子设备包含语音助手,所述方法包括:

14.根据权利要求13所述的方法,其特征在于,所述第一语音和所述第二语音均不包含用于唤醒所述语音助手的唤醒词。

15.根据权利要求13或14所述的方法,其特征在于,所述提供第一提示,具体包括:

16.根据权利要求13-15中任一项所述的方法,其特征在于,所述响应于所述第一语音,提供第一提示,具体包括:

17.根据权利要求16所述的方法,其特征在于,所述确定所述第二语音与所述第一指令匹配,具体包括:

18.根据权利要求16所述的方法,其特征在于,所述确定所述第二语音与所述第一指令匹配之前,所述方法还包括:

19.根据权利要求13-17中任一项所述的方法,其特征在于,所述确定所述第二语音与所述第一指令匹配之后,所述方法还包括:

20.根据权利要求18或19所述的方法,其特征在于,所述唤醒所述语音助手之后,所述方法还包括:

21.根据权利要求13-20中任一项所述的方法,其特征在于,所述方法还包括:

22.一种电子设备,其特征在于,所述电子设备包括:麦克风、存储器、一个或多个处理器,所述麦克风用于采集语音,所述存储器用于存储计算机程序,所述一个或多个处理器用于调用所述计算机程序,使得所述电子设备执行权利要求1-12或13-21中任一项所述的方法。

23.一种计算机可读存储介质,包括指令,其特征在于,当所述指令在电子设备上运行,使得所述电子设备执行权利要求1-12或13-21中任一项所述的方法。

24.一种计算机程序产品,其特征在于,所述计算机程序产品包含计算机指令,当所述计算机指令在电子设备上运行,使得所述电子设备执行权利要求1-12或13-21中任一项所述的方法。

...

【技术特征摘要】

1.一种语音交互方法,所述方法应用于电子设备,其特征在于,所述电子设备包含语音助手,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述第一语音和所述第二语音均不包含用于唤醒所述语音助手的唤醒词。

3.根据权利要求1或2所述的方法,其特征在于,所述确定所述第一语音与第一列表中的第一意图匹配,具体包括:

4.根据权利要求1-3中任一项所述的方法,其特征在于,所述唤醒所述语音助手之后,所述方法还包括:

5.根据权利要求1-4中任一项所述的方法,其特征在于,所述第一列表对应第一句式列表和第一实体列表,所述第一句式列表包含一个或多个句式,所述第一实体列表包含一个或多个实体,所述第一列表中的一个或多个意图由所述第一句式列表中的句式与所述第一实体列表中的实体组成;所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,所述方法还包括:

7.根据权利要求6所述的方法,其特征在于,所述方法还包括:

8.根据权利要求1-7中任一项所述的方法,其特征在于,所述方法还包括:

9.根据权利要求8所述的方法,其特征在于,所述提供第一提示之后,所述方法还包括:

10.根据权利要求8所述的方法,其特征在于,所述提供第一提示之后,所述方法还包括:

11.根据权利要求8-10中任一项所述的方法,其特征在于,所述提供第一提示,具体包括:

12.根据权利要求8-11中任一项所述的方法,其特征在于,所述第一列表包括第六意图,所述方法还包括:

13.一种语音交互方法,所述方法应用于电子设备,其特征在于,所述电子设备包含语音助手,所述方法包括:

14...

【专利技术属性】
技术研发人员:耿杰柴海水赵伟金洪宾孙思聪
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1