一种语音唤醒方法及装置制造方法及图纸

技术编号:12744257 阅读:121 留言:0更新日期:2016-01-21 11:57
本发明专利技术实施例提供一种语音唤醒方法及装置。该方法包括:对音频信号进行周期性采样,其中,在ti时刻采样得到采样信号;计算采样信号的音频能量;在音频能量大于或等于ti时刻的第一阈值时,唤醒DSP进行语音激活检测VAD;当VAD检测失败,且在ti时刻之前已连续n次检测失败,以及第一噪声能量与ti时刻的第一阈值的差值大于预设的第一门限值时,根据第一噪声能量生成第二阈值,并将第二阈值作为ti+1时刻的第一阈值,其中,第一噪声能量是通过以第一抽取率1/x对采样信号进行抽取,并对抽取出的采样点进行慢速跟踪滤波得到。本发明专利技术实施例可以减少进行VAD的次数,实现终端在嘈杂环境下功耗的降低。

【技术实现步骤摘要】

本专利技术实施例涉及语音唤醒技术,尤其涉及一种语音唤醒方法及装置
技术介绍
随着科学技术的发展,终端普遍具有语音唤醒功能,使用者使用语音唤醒终端并 对其进行相应的语音控制。 目前的语音唤醒方案是采用麦克风激活检测(Microphone Activity Detection, 简称:MAD)电路和数字信号处理器(Digital Signal Processor,简称:DSP)两级配合来唤 醒终端。其中,如果MD电路检测到的当前音频信号的能量大于预设阈值,则唤醒DSP进行 语音激活检测(Voice Activity Detection,简称:VAD),以通过VAD识别上述音频信号是 否为用户的语音;若是,则唤醒终端;若否,DSP唤醒为无效唤醒或误唤醒。具体地,VAD通 过比对上述音频信号的特征与用户的语音的特征,来判断语音信号是否为用户的语音。 采用上述语音唤醒方案,当终端处于不同的环境时,例如由安静环境切换到嘈杂 环境下,由于预设阈值是固定的,因此经常会出现无效唤醒或者误唤醒的现象,导致终端在 嘈杂环境下的功耗偏高。
技术实现思路
本专利技术实施例提供一种语音唤醒方法及装置,以降低终端在嘈杂环境下的功耗。 第一方面,本专利技术实施例提供一种语音唤醒方法,包括: 对音频信号进行周期性采样,其中,在^时刻采样得到采样信号y p i为正整数; 计算所述采样信号yi的音频能量T 1; 在所述音频能量1\大于或等于所述t ^寸刻的第一阈值A。的情况下,进行语音激 活检测VAD ; 当VAD已连续η次检测失败,且当VAD检测失败,且在所述^时刻之前已连续η次 检测失败,以及第一噪声能量S。与所述t #寸刻的第一阈值A。的差值大于预设的第一门限 值M。时,根据所述第一噪声能量S。生成第二阈值A i,并将所述第二阈值A1作为t 1+1时刻的 第一阈值A。,其中,所述第一噪声能量S。是通过以第一抽取率1/x对所述采样点y i进行抽 取,并对抽取出的采样点ys进行慢速跟踪滤波得到,X为大于1的自然数,η为正整数且η 小于i。 结合第一方面,在第一方面的第一种可能的实现方式中,所述根据所述第一噪声 能量S。生成第二阈值A i,包括: 将所述第一噪声能量S。作为所述第二阈值A 1; 或者,将所述第一噪声能量S。与预设的第一修正量N。之和作为所述第二阈值A 1; 或者,将所述第一噪声能量S。与预设的第一系数a。之积作为所述第二阈值A 1<3 结合第一方面,在第一方面的第二种可能的实现方式中,在所述计算所述采样信 号的音频能量T ;之后,还包括: 在所述音频能量T/j、于所述t ^寸刻的第一阈值A。,且从h "时刻直至t ^寸刻各自 的第一阈值A。与第二噪声能量F。的差值都大于预设的第二门限值M ^勺情况下,进行VAD, m为正整数且m小于i ; 当VAD检测成功时,根据所述第二噪声能量F。生成第三阈值A 2,并将所述第三阈 值A2作为t 1+1时刻的第一阈值A。,其中,所述第二噪声能量F。是通过以第二抽取率1/z对 所述采样信号7 1进行抽取,并对抽取出的采样点yf进行快速跟踪滤波得到,其中,z为大于 X的自然数。 结合第一方面的第二种可能的实现方式,在第一方面的第三种可能的实现方式 中,所述根据所述第二噪声能量F。生成第三阈值A 2,包括: 将所述第二噪声能量F。作为所述第三阈值A 2; 或者,将所述第二噪声能量F。与预设的第二修正量N之和作为所述第三阈值A 2; 或者,将所述第二噪声能量F。与预设的第二系数a 积作为所述第三阈值A 2。 结合第一方面的第二种或第三种可能的实现方式,在第一方面的第四种可能的实 现方式中,在将所述第三阈值A 2作为t 1+1时刻的第一阈值A。之前,还包括: 记录所述^时刻为降低阈值时刻; 当所述h时刻与上一降低阈值时刻的时间间隔大于预设值T tlJ寸,执行所述将所 述第三阈值A2作为t 1+1时刻的第一阈值A。的步骤,否则,不执行所述将所述第三阈值A 2作 为t1+1时刻的第一阈值A。的步骤。 结合第一方面,在第一方面的第五种可能的实现方式中,在所述计算所述采样信 号的音频能量T ;之后,还包括: 在所述音频能量T/j、于所述t财刻的第一阈值A。,且所述^时刻的第一阈值A。 与所述第一噪声能量S。的差值大于预设的第三门限值^的情况下,根据所述第一噪声能量 S。生成第四阈值A 3,并将所述第四阈值A3作为t 1+1时刻的第一阈值A。。 结合第一方面的第五种可能的实现方式,在第一方面的第六种可能的实现方式 中,所述根据所述第一噪声能量S。生成第四阈值A 3,包括: 将所述第一噪声能量S。作为所述第四阈值A 3; 或者,将所述第一噪声能量S。与预设的第三修正量N 2之和作为所述第四阈值A 3; 或者,将所述第一噪声能量S。与预设的第三系数a 2之积作为所述第四阈值A 3。 结合第一方面的第五种或第六种可能的实现方式,在第一方面的第七种可能的实 现方式中,在将所述第四阈值A 3作为t 1+1时刻的第一阈值A。之前,还包括: 记录所述^时刻为降低阈值时刻; 当所述h时刻与上一降低阈值时刻的时间间隔大于预设值T tllJ寸,执行所述将所 述第四阈值A3作为t 1+1时刻的第一阈值A。的步骤,否则,不执行所述将所述第四阈值A 3作 为t1+1时刻的第一阈值A。的步骤。 第二方面,本专利技术实施例提供一种语音唤醒装置,包括: 采样频率转换器SRC,用于对音频信号进行周期性采样,其中,在h时刻采样得到 采样信号 yi,i为正整数; 运算电路,用于计算所述采样信号yi的音频能量T 1; 阈值判决电路,用于判断所述音频能量T1是否大于或等于所述t ^寸刻的第一阈值 A。;在所述音频能量T 1大于或等于所述t 4寸刻的第一阈值A。的情况下,触发中断处理电路 输出中断脉冲信号给中断控制电路,由所述中断控制电路使能数字信号处理器DSP或处理 器进行语音激活检测VAD ; 第一抽取器,所述第一抽取器的输入端耦合至所述SRC的输出端,用于以第一抽 取率1/x对所述采样信号 yi进行抽取得到采样点ys,X为大于1的自然数; 慢速跟踪滤波器STF,所述STF的输入端耦合至所述第一抽取器的输出端,用于对 所述抽取得到采样点ys进行慢速跟踪滤波得到第一噪声能量S。; 比较器,所述比较器的输入端耦合至与所述STF的输出端及所述阈值判决电路, 用于比较所述第一噪声能量S。与所述t 4寸刻的第一阈值A。的差值是否大于预设的第一门 限值M。; 配置器,用于当VAD检测失败,且在所述^时刻之前已连续η次检测失败,以及所 述第一噪声能量S。与所述t ^寸刻的第一阈值A。的差值大于预设的第一门限值M。时,根据 所述第一噪声能量S。生成第二阈值A i,并将所述第二阈值A1作为t i+1时刻的第一阈值A。, 下发至所述阈值判决电路,η为正整数且η小于i。 结合第二方面,在第二方面的第一种可能的实现方式中,所述配置器具体用于: 将所述第一噪声能量S。作为所述第二阈值A 1; 或者,将所述第一噪声能量S。与预设的第一修正量N。之和作为所述第二阈值A 1; 或者,将所述第一噪声能量S。与预设的第一系数a。之积作为所述第二阈值A 1<本文档来自技高网...

【技术保护点】
一种语音唤醒方法,其特征在于,包括:对音频信号进行周期性采样,其中,在ti时刻采样得到采样信号yi,i为正整数;计算所述采样信号yi的音频能量Ti;在所述音频能量Ti大于或等于所述ti时刻的第一阈值A0的情况下,进行语音激活检测VAD;当VAD检测失败,且在所述ti时刻之前已连续n次检测失败,以及第一噪声能量S0与所述ti时刻的第一阈值A0的差值大于预设的第一门限值M0时,根据所述第一噪声能量S0生成第二阈值A1,并将所述第二阈值A1作为ti+1时刻的第一阈值A0,其中,所述第一噪声能量S0是通过以第一抽取率1/x对所述采样信号yi进行抽取,并对抽取出的采样点ys进行慢速跟踪滤波得到,x为大于1的自然数,n为正整数且n小于i。

【技术特征摘要】

【专利技术属性】
技术研发人员:马涛
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1