一种语音唤醒方法、装置、介质和设备制造方法及图纸

技术编号:27659087 阅读:20 留言:0更新日期:2021-03-12 14:25
本发明专利技术涉及一种语音唤醒方法、装置、介质和设备。根据本发明专利技术实施例提供的方案,可以通过两级唤醒模块来进行语音唤醒,每一级唤醒模块确定是否应唤醒智能设备的时长均不大于对应的设定值,从而可以通过负载均衡的方式,减轻每一级唤醒模块的计算量,降低每一级唤醒模块的功耗,避免计算能力不足的问题。

【技术实现步骤摘要】
一种语音唤醒方法、装置、介质和设备
本专利技术涉及人工智能
,特别涉及一种语音唤醒方法、装置、介质和设备。
技术介绍
语音交互是当前应用最多的智能人机交互方式。在进行语音交互时,目前常见的方式是用户根据唤醒词,语音唤醒智能设备后,再与智能设备进行语音交互。因此,语音唤醒是语音交互的重要环节。目前常见的语音唤醒方案,是智能设备中的唤醒模块进行一次唤醒词检测。其中,唤醒模块会确定连续输入的音频数据中,是否包括指定的唤醒词对应的特征序列,如果确定包括指定的唤醒词对应的特征序列,则认为应当唤醒,此时,唤醒模块可以唤醒智能设备。语音唤醒的重点在于提高唤醒率,降低误唤醒率。如果唤醒词检测的计算量较小,则无法有效保证提高唤醒率,降低误唤醒率。而为了提高唤醒率,降低误唤醒率,唤醒模块进行一次唤醒词检测的过程中,唤醒词检测的计算量通常会变大,此时,由于计算量的变大,会导致唤醒模块的功耗较大的问题产生。
技术实现思路
本专利技术实施例提供一种语音唤醒方法、装置、介质和设备,用于解决唤醒模块的功耗较大的问题。本专利技术提供了一种语音唤醒方法,所述方法包括:第一级唤醒模块接收连续输入的音频数据,根据所述音频数据,确定是否应唤醒智能设备,所述第一级唤醒模块确定是否应唤醒智能设备的时长不大于第一设定值;若所述第一级唤醒模块确定应唤醒智能设备,则将所述音频数据发送给第二级唤醒模块;所述第二级唤醒模块根据所述音频数据,确定是否应唤醒智能设备,所述第二级唤醒模块确定是否应唤醒智能设备的时长不大于第二设定值;若所述第二级唤醒模块确定应唤醒智能设备,则唤醒智能设备。本专利技术还提供了一种语音唤醒装置,所述装置包括:第一级唤醒模块,用于接收连续输入的音频数据,根据所述音频数据,确定是否应唤醒智能设备,所述第一级唤醒模块确定是否应唤醒智能设备的时长不大于第一设定值;并在确定应唤醒智能设备时,将所述音频数据发送给第二级唤醒模块;第二级唤醒模块,用于根据所述音频数据,确定是否应唤醒智能设备,所述第二级唤醒模块确定是否应唤醒智能设备的时长不大于第二设定值;并在确定应唤醒智能设备时,唤醒智能设备。本专利技术还提供了一种非易失性计算机存储介质,所述计算机存储介质存储有可执行程序,该可执行程序被处理器执行实现如上所述的方法。本专利技术还提供了一种语音唤醒设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;所述存储器,用于存放计算机程序;所述处理器,用于执行所述存储器上所存储的程序时,实现如上所述的方法步骤。根据本专利技术实施例提供的方案,可以通过两级唤醒模块来进行语音唤醒,每一级唤醒模块确定是否应唤醒智能设备的时长均不大于对应的设定值,从而可以通过负载均衡的方式,减轻每一级唤醒模块的计算量,降低每一级唤醒模块的功耗,避免计算能力不足的问题。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例一提供的语音唤醒方法的流程示意图;图2为本专利技术实施例二提供的语音唤醒装置的结构示意图;图3为本专利技术实施例三提供的语音唤醒设备的结构示意图。具体实施方式为了保证语音唤醒的准确性,现有的语音唤醒方案中,唤醒模块的计算量很大,导致功耗很大,因此,本专利技术实施例提供一种负载均衡的语音唤醒方案,通过设置两级唤醒模块的方式,来减少每个唤醒模块的计算量,降低功耗。当然,在本专利技术实施例提供的方案的基础上,还可以进一步设置多于两级的唤醒模块,如设置三级唤醒模块等方式,来实现负载均衡的语音唤醒。为了使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术作进一步地详细描述,显然,所描述的实施例仅仅是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,在本文中提及的“多个或者若干个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。实施例一本专利技术实施例一提供一种语音唤醒方法,该方法的步骤流程可以如图1所示,包括:步骤101、第一级唤醒模块接收音频数据。在本步骤中,第一级唤醒模块可以接收连续输入的音频数据,以便根据接收到的连续输入的音频数据,确定是否应唤醒智能设备。连续输入的音频数据可以理解为用户发出的语音唤醒指令,如包括唤醒词的语音唤醒指令。步骤102、第一级唤醒模块确定是否应唤醒智能设备。在本步骤中,第一级唤醒模块可以根据接收到的音频数据,确定是否应唤醒智能设备。在本实施例中,第一级唤醒模块可以理解为长时间实时运行的唤醒模块。针对第一级唤醒模块,为了避免功耗较大,计算能力不足的问题,可以选择计算量较少的方法来确定是否应唤醒智能设备。且在本实施例中,可以利用计算时长来评估计算量的大小。因此,在本实施例中,可以设置第一级唤醒模块确定是否应唤醒智能设备的时长不大于第一设定值。进一步的,为了进一步保证语音唤醒的准确性,还可以设置第一级唤醒模块确定是否应唤醒智能设备的时长不小于第三设定值。需要说明的是,第一级唤醒模块根据接收到的音频数据,确定是否应唤醒智能设备所采用的方法可以为任意方法。在一种可能的实现方式中,根据接收到的音频数据,确定是否应唤醒智能设备,可以包括:确定接收到的音频数据中是否包括指定的唤醒词对应的特征序列,或者,确定接收到的音频数据对应的声纹特征是否符合指定用户的声纹特征。即在本实施例中,可以通过对接收到的音频数据中,指定的唤醒词的特征识别,或者对指定用本文档来自技高网...

【技术保护点】
1.一种语音唤醒方法,其特征在于,所述方法包括:/n第一级唤醒模块接收连续输入的音频数据,根据所述音频数据,确定是否应唤醒智能设备,所述第一级唤醒模块确定是否应唤醒智能设备的时长不大于第一设定值;/n若所述第一级唤醒模块确定应唤醒智能设备,则将所述音频数据发送给第二级唤醒模块;/n所述第二级唤醒模块根据所述音频数据,确定是否应唤醒智能设备,所述第二级唤醒模块确定是否应唤醒智能设备的时长不大于第二设定值;/n若所述第二级唤醒模块确定应唤醒智能设备,则唤醒智能设备。/n

【技术特征摘要】
1.一种语音唤醒方法,其特征在于,所述方法包括:
第一级唤醒模块接收连续输入的音频数据,根据所述音频数据,确定是否应唤醒智能设备,所述第一级唤醒模块确定是否应唤醒智能设备的时长不大于第一设定值;
若所述第一级唤醒模块确定应唤醒智能设备,则将所述音频数据发送给第二级唤醒模块;
所述第二级唤醒模块根据所述音频数据,确定是否应唤醒智能设备,所述第二级唤醒模块确定是否应唤醒智能设备的时长不大于第二设定值;
若所述第二级唤醒模块确定应唤醒智能设备,则唤醒智能设备。


2.如权利要求1所述的方法,其特征在于,根据所述音频数据,确定是否应唤醒智能设备,包括:
确定所述音频数据中是否包括指定的唤醒词对应的特征序列,或者,确定所述音频数据对应的声纹特征是否符合指定用户的声纹特征。


3.如权利要求1所述的方法,其特征在于,若所述第一级唤醒模块确定应唤醒智能设备,则将所述音频数据发送给第二级唤醒模块,包括:
若所述第一级唤醒模块确定应唤醒智能设备,则将所述音频数据中的至少部分音频数据发送给第二级唤醒模块;
所述第二级唤醒模块根据所述音频数据,确定是否应唤醒智能设备,包括:
所述第二级唤醒模块根据所述至少部分音频数据,确定是否应唤醒智能设备。


4.如权利要求1所述的方法,其特征在于,所述第二级唤醒模块的数量为一个或至少两个。


5.如权利要求4所述的方法,其特征在于,若所述第二级唤醒模块的数量为至少两个,则,每一个第二级唤醒模块根据所述音频数据,确定是否应唤醒智能设备时,针对的音频数据的特征不相同和/或使用的计算模型不相同。


6.如权利要求4或5所述的方法,其特征在于,若所述第二级唤醒模块的数量为至少两个...

【专利技术属性】
技术研发人员:冯大航陈孝良韩赞常乐
申请(专利权)人:北京声智科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1