语音唤醒方法、装置、智能语音设备、车辆及存储介质制造方法及图纸

技术编号：35192071 阅读：20 留言：0更新日期：2022-10-12 18:13

本公开提出一种语音唤醒方法、装置、智能语音设备、车辆及存储介质，该方法包括：在数字信号处理器处于第一功耗模式时，接收输入语音，从输入语音中识别与关键词对应的初始语音段，处理初始语音段得到目标语音信号，根据目标语音信号，对智能语音设备中目标应用程序进行唤醒控制。通过本公开，能够有效避免影响关键词识别的准确率，避免误唤醒目标应用程序，提升语音唤醒效果。提升语音唤醒效果。提升语音唤醒效果。

全部详细技术资料下载

【技术实现步骤摘要】
语音唤醒方法、装置、智能语音设备、车辆及存储介质

[0001]本公开涉及智能语音
，尤其涉及一种语音唤醒方法、装置、智能语音设备、车辆及存储介质。

技术介绍

[0002]随着智能语音技术的发展，市场上出现了各类智能语音设备，语音唤醒是智能语音设备(智能语音设备例如，终端、智能玩具、智能家电、车载系统等)与用户交互的入口，是指智能语音设备在休眠或锁屏状态下，如果检测到特定语音指令，则处于休眠状态下的智能语音设备进入到等待指令状态，以开启语音交互。根据识别对象的不同，可分为关键词识别和声纹识别：关键词识别，指在连续的语音流中，识别出特定的语音唤醒词，而声纹识别，用于提取说话人声音特征以核验说话人身份。
[0003]相关技术中，通常在进行关键词识别前，首先在智能语音设备中的数字信号处理器(Digital Signal Processing，DSP)处于低功耗空闲模式时进行语音活动检测(Voice Activity Detection，VAD)，VAD可以用于从输入语音里识别出有效的语音信号，并消除持续的静音，而后，在智能语音设备中的数字信号处理器(Digital Signal Processing，DSP)处于低功耗空闲模式时进行关键词识别，并基于识别所得关键词的语音段传输至目标应用程序(Application，APP)，以进行唤醒控制。
[0004]这种方式下，有效语音信号的检测占用低功耗空闲模式(Low Power Idle，LPI)下数字信号处理器DSP的内存空间，导致关键词识别阶段只能使用轻量...

【技术保护点】

【技术特征摘要】
1.一种语音唤醒方法，其特征在于，被智能语音设备执行，所述智能语音设备包括：数字信号处理器，所述方法包括：在所述数字信号处理器处于第一功耗模式时，接收输入语音；从所述输入语音中识别与关键词对应的初始语音段；处理所述初始语音段得到目标语音信号；根据所述目标语音信号，对所述智能语音设备中目标应用程序进行唤醒控制。2.如权利要求1所述的方法，其特征在于，所述处理所述初始语音段得到目标语音信号，包括：在所述数字信号处理器处于所述第一功耗模式时，处理所述初始语音段得到目标语音信号。3.如权利要求1所述的方法，其特征在于，所述处理所述初始语音段得到目标语音信号，包括：控制所述数字信号处理器由处于所述第一功耗模式切换至处于第二功耗模式，其中，所述数字信号处理器在处于所述第二功耗模式时的功耗大于在处于所述第一功耗模式时的功耗；在所述数字信号处理器处于所述第二功耗模式时，处理所述初始语音段得到目标语音信号。4.如权利要求3所述的方法，其特征在于，所述在所述数字信号处理器处于所述第二功耗模式时，处理所述初始语音段得到目标语音信号，包括：在所述数字信号处理器处于所述第二功耗模式时，处理所述初始语音段得到第一语音信号；如果所述第一语音信号满足第一有效性条件，则将所述第一语音信号作为所述目标语音信号；如果所述第一语音信号不满足所述第一有效性条件，则控制所述数字信号处理器由处于所述第二功耗模式切换回处于所述第一功耗模式。5.如权利要求1所述的方法，其特征在于，所述处理所述初始语音段得到目标语音信号，包括：在硬件抽象层HAL中，处理所述初始语音段得到目标语音信号。6.如权利要求5所述的方法，其特征在于，所述在硬件抽象层HAL中，处理所述初始语音段得到目标语音信号，包括：在所述硬件抽象层HAL中，处理所述初始语音段得到第二语音信号；如果所述第二语音信号满足第二有效性条件，则将所述第二语音信号作为所述目标语音信号；如果所述第二语音信号不满足所述第二有效性条件，则由所述硬件抽象层HAL输出语音检测消息，其中，所述语音检测消息用于检测所述输入语音。7.如权利要求3或5所述的方法，其特征在于，在所述从所述输入语音中识别与关键词对应的初始语音段之后，还包括：对所述初始语音段进行复制处理，得到复制语音段；将所述复制语音段保存至所述智能语音设备的内存之中。
8.如权利要求7所述的方法，其特征在于，所述在所述数字信号处理器处于所述第二功耗模式时，处理所述初始语音段得到目标语音信号，包括：在所述数字信号处理器处于所述第二功耗模式时，从所述智能语音设备的内存之中读取所述复制语音段；处理所述复制语音段得到所述目标语音信号。9.如权利要求7所述的方法，其特征在于，所述在硬件抽象层HAL中，处理所述初始语音段得到目标语音信号，包括：控制所述硬件抽象层HAL中的目标组件，从所述智能语音设备的内存之中读取所述复制语音段；处理所述复制语音段得到所述目标语音信号。10.如权利要求1
‑
9任一项所述的方法，其特征在于，所述智能语音设备是车载设备，所述输入语音是所述车载设备捕获的车辆控制语音。11.一种语音唤醒装置，其特征在于，被智能语音设备执行，所述智能语音设备包括：数字信号处理器，所述装置包括：接收模块，用于在所述数字信号处理器处于第一功耗模式时，接收输入语音；识别模块，用于从所述输入语音中识别与关键词对应的初始语音段；第一处理模块，用于处理所述初始语音段得到目标语...

【专利技术属性】
技术研发人员：赵惟肖，
申请(专利权)人：北京小米移动软件有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人