语音唤醒方法、装置、智能语音设备、车辆及存储介质制造方法及图纸

技术编号:35192071 阅读:20 留言:0更新日期:2022-10-12 18:13
本公开提出一种语音唤醒方法、装置、智能语音设备、车辆及存储介质,该方法包括:在数字信号处理器处于第一功耗模式时,接收输入语音,从输入语音中识别与关键词对应的初始语音段,处理初始语音段得到目标语音信号,根据目标语音信号,对智能语音设备中目标应用程序进行唤醒控制。通过本公开,能够有效避免影响关键词识别的准确率,避免误唤醒目标应用程序,提升语音唤醒效果。提升语音唤醒效果。提升语音唤醒效果。

【技术实现步骤摘要】
语音唤醒方法、装置、智能语音设备、车辆及存储介质


[0001]本公开涉及智能语音
,尤其涉及一种语音唤醒方法、装置、智能语音设备、车辆及存储介质。

技术介绍

[0002]随着智能语音技术的发展,市场上出现了各类智能语音设备,语音唤醒是智能语音设备(智能语音设备例如,终端、智能玩具、智能家电、车载系统等)与用户交互的入口,是指智能语音设备在休眠或锁屏状态下,如果检测到特定语音指令,则处于休眠状态下的智能语音设备进入到等待指令状态,以开启语音交互。根据识别对象的不同,可分为关键词识别和声纹识别:关键词识别,指在连续的语音流中,识别出特定的语音唤醒词,而声纹识别,用于提取说话人声音特征以核验说话人身份。
[0003]相关技术中,通常在进行关键词识别前,首先在智能语音设备中的数字信号处理器(Digital Signal Processing,DSP)处于低功耗空闲模式时进行语音活动检测(Voice Activity Detection,VAD),VAD可以用于从输入语音里识别出有效的语音信号,并消除持续的静音,而后,在智能语音设备中的数字信号处理器(Digital Signal Processing,DSP)处于低功耗空闲模式时进行关键词识别,并基于识别所得关键词的语音段传输至目标应用程序(Application,APP),以进行唤醒控制。
[0004]这种方式下,有效语音信号的检测占用低功耗空闲模式(Low Power Idle,LPI)下数字信号处理器DSP的内存空间,导致关键词识别阶段只能使用轻量级识别模型,影响关键词识别的准确率,容易导致对目标应用程序APP的误唤醒,语音唤醒效果不佳。

技术实现思路

[0005]本公开旨在至少在一定程度上解决相关技术中的技术问题之一。
[0006]为此,本公开的目的在于提出一种语音唤醒方法、装置、智能语音设备、车辆、电子设备及存储介质,有效避免影响关键词识别的准确率,避免误唤醒目标应用程序,提升语音唤醒效果。
[0007]本公开第一方面实施例提出的语音唤醒方法,包括:在所述数字信号处理器处于第一功耗模式时,接收输入语音;从所述输入语音中识别与关键词对应的初始语音段;处理所述初始语音段得到目标语音信号;根据所述目标语音信号,对所述智能语音设备中目标应用程序进行唤醒控制。
[0008]本公开第一方面实施例提出的语音唤醒方法,通过在数字信号处理器处于第一功耗模式时,接收输入语音,从输入语音中识别与关键词对应的初始语音段,处理初始语音段得到目标语音信号,根据目标语音信号,对智能语音设备中目标应用程序进行唤醒控制,有效避免影响关键词识别的准确率,避免误唤醒目标应用程序,提升语音唤醒效果。
[0009]本公开第二方面实施例提出的语音唤醒装置,包括:接收模块,用于在所述数字信号处理器处于第一功耗模式时,接收输入语音;识别模块,用于从所述输入语音中识别与关
键词对应的初始语音段;第一处理模块,用于处理所述初始语音段得到目标语音信号;控制模块,用于根据所述目标语音信号,对所述智能语音设备中目标应用程序进行唤醒控制。
[0010]本公开第二方面实施例提出的语音唤醒装置,通过在数字信号处理器处于第一功耗模式时,接收输入语音,从输入语音中识别与关键词对应的初始语音段,处理初始语音段得到目标语音信号,根据目标语音信号,对智能语音设备中目标应用程序进行唤醒控制,能够有效避免影响关键词识别的准确率,避免误唤醒目标应用程序,提升语音唤醒效果。
[0011]本公开第三方面实施例提出一种智能语音设备,包括:本公开第二方面实施例提出的语音唤醒装置。
[0012]本公开第四方面实施例提出一种车辆,包括:本公开第二方面实施例提出的语音唤醒装置。
[0013]本公开第五方面实施例提出了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如本公开第一方面实施例提出的语音唤醒方法。
[0014]本公开第六方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开第一方面实施例提出的语音唤醒方法。
[0015]本公开第七方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,执行如本公开第一方面实施例提出的语音唤醒方法。
[0016]本公开附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。
附图说明
[0017]本公开上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0018]图1是本公开一实施例提出的语音唤醒方法的流程示意图;
[0019]图2是本公开实施例中一语音唤醒的流程示意图;
[0020]图3是本公开另一实施例提出的语音唤醒方法的流程示意图;
[0021]图4是本公开另一实施例提出的语音唤醒方法的流程示意图;
[0022]图5是本公开实施例中另一语音唤醒流程示意图;
[0023]图6是本公开一实施例提出的语音唤醒装置的结构示意图;
[0024]图7是本公开另一实施例提出的语音唤醒装置的结构示意图;
[0025]图8是本公开一实施例提出的智能语音设备的结构示意图;
[0026]图9是本公开一实施例提出的车辆的结构示意图;
[0027]图10示出了适于用来实现本公开实施方式的示例性电子设备的框图。
具体实施方式
[0028]下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本公开,而不能理解为对本公开的限制。相反,本公开的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同
物。
[0029]图1是本公开一实施例提出的语音唤醒方法的流程示意图。
[0030]其中,需要说明的是,本实施例的语音唤醒方法的执行主体为语音唤醒装置,该装置可以由软件和/或硬件的方式实现,该装置可以配置在智能语音设备中,对此不做限制。
[0031]本实施例中的语音唤醒方法可以应用于智能语音设备,智能语音设备,是一种经由通信设施向其他设备发送数据或接收其他设备数据的设备,也即是说,该智能语音设备可以例如为能够进行网络通信连接的智能手机、智能手表、便携式计算机、智能玩具、智能家电、车载语音系统等,对此不做限制。
[0032]本公开实施例中的智能语音设备包括:数字信号处理器,其中,可以在智能语音设备中的数字信号处理器(Digital Signal Processing,DSP)处于低功耗空闲模式时进行关键词识别,并基于识别所得关键词的语音段进行语音唤醒。
[0033]本公开实施例中的应用场景可以举例说明如下:
[0034]语音助手和服务本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音唤醒方法,其特征在于,被智能语音设备执行,所述智能语音设备包括:数字信号处理器,所述方法包括:在所述数字信号处理器处于第一功耗模式时,接收输入语音;从所述输入语音中识别与关键词对应的初始语音段;处理所述初始语音段得到目标语音信号;根据所述目标语音信号,对所述智能语音设备中目标应用程序进行唤醒控制。2.如权利要求1所述的方法,其特征在于,所述处理所述初始语音段得到目标语音信号,包括:在所述数字信号处理器处于所述第一功耗模式时,处理所述初始语音段得到目标语音信号。3.如权利要求1所述的方法,其特征在于,所述处理所述初始语音段得到目标语音信号,包括:控制所述数字信号处理器由处于所述第一功耗模式切换至处于第二功耗模式,其中,所述数字信号处理器在处于所述第二功耗模式时的功耗大于在处于所述第一功耗模式时的功耗;在所述数字信号处理器处于所述第二功耗模式时,处理所述初始语音段得到目标语音信号。4.如权利要求3所述的方法,其特征在于,所述在所述数字信号处理器处于所述第二功耗模式时,处理所述初始语音段得到目标语音信号,包括:在所述数字信号处理器处于所述第二功耗模式时,处理所述初始语音段得到第一语音信号;如果所述第一语音信号满足第一有效性条件,则将所述第一语音信号作为所述目标语音信号;如果所述第一语音信号不满足所述第一有效性条件,则控制所述数字信号处理器由处于所述第二功耗模式切换回处于所述第一功耗模式。5.如权利要求1所述的方法,其特征在于,所述处理所述初始语音段得到目标语音信号,包括:在硬件抽象层HAL中,处理所述初始语音段得到目标语音信号。6.如权利要求5所述的方法,其特征在于,所述在硬件抽象层HAL中,处理所述初始语音段得到目标语音信号,包括:在所述硬件抽象层HAL中,处理所述初始语音段得到第二语音信号;如果所述第二语音信号满足第二有效性条件,则将所述第二语音信号作为所述目标语音信号;如果所述第二语音信号不满足所述第二有效性条件,则由所述硬件抽象层HAL输出语音检测消息,其中,所述语音检测消息用于检测所述输入语音。7.如权利要求3或5所述的方法,其特征在于,在所述从所述输入语音中识别与关键词对应的初始语音段之后,还包括:对所述初始语音段进行复制处理,得到复制语音段;将所述复制语音段保存至所述智能语音设备的内存之中。
8.如权利要求7所述的方法,其特征在于,所述在所述数字信号处理器处于所述第二功耗模式时,处理所述初始语音段得到目标语音信号,包括:在所述数字信号处理器处于所述第二功耗模式时,从所述智能语音设备的内存之中读取所述复制语音段;处理所述复制语音段得到所述目标语音信号。9.如权利要求7所述的方法,其特征在于,所述在硬件抽象层HAL中,处理所述初始语音段得到目标语音信号,包括:控制所述硬件抽象层HAL中的目标组件,从所述智能语音设备的内存之中读取所述复制语音段;处理所述复制语音段得到所述目标语音信号。10.如权利要求1

9任一项所述的方法,其特征在于,所述智能语音设备是车载设备,所述输入语音是所述车载设备捕获的车辆控制语音。11.一种语音唤醒装置,其特征在于,被智能语音设备执行,所述智能语音设备包括:数字信号处理器,所述装置包括:接收模块,用于在所述数字信号处理器处于第一功耗模式时,接收输入语音;识别模块,用于从所述输入语音中识别与关键词对应的初始语音段;第一处理模块,用于处理所述初始语音段得到目标语...

【专利技术属性】
技术研发人员:赵惟肖
申请(专利权)人:北京小米移动软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1