【技术实现步骤摘要】
一种语音关键词的识别方法及识别电路
[0001]本专利技术涉及语音关键词识别
,尤其涉及一种语音关键词的识别方法及识别电路。
技术介绍
[0002]语音的关键词识别技术(Keywords Spotting,KWS)是在一段语音中,识别出一个或多个特定的关键词。以如今常见的关键词唤醒物联网设备为例,在一段复杂的语音中,往往只有小段语音包含关键词信号。因此若KWS模块能以极低的功耗保持常开,在准确地识别到语音关键词后,再唤醒后续庞大的处理系统,便可以节约大量功耗。
[0003]一个KWS系统由前端的特征提取和后端的分类模型两部分构成。特征提取部分,常用的特征参数包括梅尔频率倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)、短时能量和过零率等,其中MFCC由于更加符合人耳听觉、特征更完备而被广泛应用于语音信号处理的各领域中。
[0004]如图1所示,目前现有的MFCC计算方法的电路实现都是在数字域中,语音信号通过放大器放大后,使用模数转换器(Analog to Di ...
【技术保护点】
【技术特征摘要】
1.一种语音关键词的识别方法,其特征在于,在模拟域下计算语音信号的梅尔频率倒谱系数,包括如下步骤:S1:麦克风输出的信号经过低噪声放大器得到放大后的信号;S2:利用帕萨瓦尔定理将所述放大后的信号在时域中经过平方器进行平方,得到平方后的信号;S3:采用一组梅尔频率内呈线性的滤波器组对所述平方后的信号进行带通滤波,得到滤波后的信号;S4:对所述滤波后的信号进行积分得到积分后的信号;S5:采用对数运算电路对所述积分后的信号实现对数运算;S6:对数运算得到的结果进行离散余弦变换得到所述语音信号的梅尔频率倒谱系数。2.如权利要求1所述的语音关键词的识别方法,其特征在于,利用帕萨瓦尔定理将所述放大后的信号在时域中经过平方器进行平方,得到平方后的信号,再对所述平方后的信号进行积分:其中,x(t)是原信号,X(ω)是傅里叶变换后的信号,t是时域单位,ω是频域单位。3.如权利要求2所述的语音关键词的识别方法,其特征在于,所述滤波器组是带通滤波器,其传输函数H(s)表示为:其中,A、B、C、D是系数,s是复频域单位。4.如权利要求2所述的语音关键词的识别方法,其特征在于,对所述对数运算得到的结果进行离散余弦变换包括:将所述对数运算得到的结果根据系数矩阵转换为电流再相加,所述系数矩阵:其中,a、b、c、d、e、f、g是参数。5.一种语音关键词的识别电路,其特征在于,用于实现如权利要求1
‑
4任一所述的语音关键词的识别方法,包括:放大单元,用于将所述麦克风输出的信号经过低噪声放大器得到放大后的信号;平方单元,用于利用帕萨瓦尔定理将所述放大后的信号在时域中经过平方器进行平方,得到平方后的信号;
滤波单元,用于对所述平方后的信号进行滤波得到滤波后的信号;积分单元,用于对所述滤波后的信号进行积分得到积分后的信号;对数运算单元,采用对数运算电路对所述积分后的信号实现对数运算;离散余弦变换单元,用于对...
【专利技术属性】
技术研发人员:唐仙,张诗滢,王志华,
申请(专利权)人:清华大学深圳国际研究生院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。