一种基于MFCC语音特征的语音匹配方法及存储介质组成比例

技术编号:19697481 阅读:31 留言:0更新日期:2018-12-08 12:39
本发明专利技术公开了一种基于MFCC语音特征的语音匹配方法,包括以下步骤:获取有效语音的MFCC特征系数;将有效语音的MFCC特征系数与预设的若干MFCC特征系数依次进行匹配,得到若干MFCC特征系数对应的若干相似值;所述预设的若干MFCC特征系数为预设的若干命令词对应的MFCC特征系数;当某一相似值小于预设相似值时,则判断有效语音的MFCC特征系数与该相似值对应的MFCC特征系数匹配成功,并提取匹配成功的MFCC特征系数对应的命令词。本发明专利技术解决命令词识别系统不联网状态下语音命令词的语音匹配问题。

【技术实现步骤摘要】
一种基于MFCC语音特征的语音匹配方法及存储介质
本专利技术涉及语音识别
,具体涉及一种基于MFCC语音特征的语音匹配方法及存储介质。
技术介绍
近十几年来,在细化模型的设计、参数提取及优化,以及系统的自适应技术上取得了一些关键进展。语音识别技术越来越成熟,准确率逐步得到提高,并且市场上有相应的语音产品。在智能录播系统中,不断的提高人机交互体验性更加便于老师不需要管理录播系统,语音命令词识别进而控制录播系统的常用功能,老师可以忘记录播系统的存在,更加专心与教学。老师上课时只需要说声“开始录制”,录播系统就开始录制视频。下课结束时说声“停止录制”即可完成一节课堂的录制。目前市场上有对应的命令词识别模块,但是大部分的应用都得联网才能实现命令词的识别,这妨碍了命令词识别功能在嵌入式录播系统的应用,小型高效的命令词识别在嵌入式系统里很有前景的。
技术实现思路
鉴于以上技术问题,本专利技术的目的在于提供一种基于MFCC语音特征的语音匹配方法及存储介质,解决命令词识别系统不联网状态下语音命令词的语音匹配问题。本专利技术采用以下技术方案:一种基于MFCC语音特征的语音匹配方法,包括以下步骤:获取有效语音的MFCC特征系数;将有效语音的MFCC特征系数与预设的若干MFCC特征系数依次进行匹配,得到若干MFCC特征系数对应的若干相似值;所述预设的若干MFCC特征系数为预设的若干命令词对应的MFCC特征系数;当某一相似值小于预设相似值时,则判断有效语音的MFCC特征系数与该相似值对应的MFCC特征系数匹配成功,并提取匹配成功的MFCC特征系数对应的命令词。进一步的,将有效语音的MFCC特征系数与预设的若干MFCC特征系数依次进行匹配的步骤具体包括将有效语音的MFCC特征系数与预设的若干MFCC特征系数依次通过DTW相似性算法进行匹配。进一步的,获取有效语音的MFCC特征系数的步骤具体包括:对有效语音依次进行分帧和加汉明窗,得到分帧加窗后的有效语音;对分帧加窗后的有效语音提取MFCC特征系数。进一步的,对分帧加窗后的有效语音提取MFCC特征系数的步骤具体包括:对分帧加窗后的有效语音进行FFT傅里叶变换,得到有效语音频谱;将有效语音频谱通过滤波器组进行,并计算通过滤波器组的有效语音频谱共振峰;根据得到的共振峰计算有效语音频谱的对数能量值x(m),根据得到的对数能量值x(m)计算有效语音频谱的MFCC特征系数。进一步的,对有效语音依次进行分帧和加汉明窗,得到分帧加窗的有效语音的步骤包括:根据预设帧长N和帧移对有效语音进行分帧,得到n帧分帧有效语音;将得到的n帧分帧有效语音均加汉明窗,汉明窗的数值W满足以下公式:其中,N为预设帧长,n为自然数。进一步的,所述共振峰Hm(k)满足以下公式:其中,Hm(k)为有效语音频谱中频率为k的频谱通过第m个滤波器时的共振峰,f(m)为第m个滤波器对应的中心频率,m为自然数。进一步的,所述对数能量值满足以下公式:对数能量值其中,x(m)为有效语音频谱通过第m个滤波器时的对数能量值,M为滤波器组中滤波器的个数,Hm(k)为有效语音频谱中频率为k的频谱通过第m个滤波器时的共振峰,X(k)为有效语音频谱中频率为k的频谱振幅,N为预设帧长,m为自然数;进一步的,所述MFCC特征系数满足以下公式:MFCC特征系数其中,Xj为第K阶梅尔特征系数,M为滤波器组中滤波器的个数,N为预设帧长,x(m)为有效语音频谱通过第m个滤波器时的对数能量值,L为MFCC系数的阶数,L、j均为自然数。进一步的,所述预设的若干命令词根据嵌入式录播系统的老师预先录制的命令词语音获取。一种计算机存储介质,实现上述的基于MFCC语音特征的语音匹配方法。相比现有技术,本专利技术的有益效果在于:本专利技术通过将获取的有效语音的MFCC特征系数与预设的若干MFCC特征系数依次进行匹配,得到若干MFCC特征系数对应的若干相似值;预设的若干MFCC特征系数为预设的若干命令词对应的MFCC特征系数;当某一相似值小于预设相似值时,则判断有效语音的MFCC特征系数与该相似值对应的MFCC特征系数匹配成功,并提取匹配成功的MFCC特征系数对应的命令词,从而实现不联网状态下语音命令词的语音匹配。进一步的,预设的若干命令词根据嵌入式录播系统的老师预先录制的命令词语音获取,这样,命令词可根据老师的说话特点,将老师说的命令词语音作为匹配模板,进一步提高了语音命令词语音匹配的准确率。附图说明图1为本专利技术基于MFCC语音特征的语音匹配方法的流程示意图;图2为本专利技术的获取有效语音的MFCC特征系数的流程示意图;图3为获取待识别语音的有效语音的流程示意图。具体实施方式下面,结合附图以及具体实施方式,对本专利技术做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例:实施例:如图1所示,本专利技术的基于MFCC语音特征的语音匹配方法包括:步骤S200:获取有效语音的MFCC特征系数;(MFCC,即Mel频率倒谱系数的缩写);具体的,如图2所示,获取有效语音的MFCC特征系数的步骤具体包括:步骤S2001:对有效语音依次进行分帧和加汉明窗,得到分帧加窗后的有效语音;步骤S2002:对分帧加窗后的有效语音提取MFCC特征系数;对分帧加窗后的有效语音提取MFCC特征系数的步骤具体包括:步骤S20021:对分帧加窗后的有效语音进行FFT傅里叶变换,得到有效语音频谱;步骤S20022:将有效语音频谱通过滤波器组进行,并计算通过滤波器组的有效语音频谱共振峰;步骤S20023:根据得到的共振峰计算有效语音频谱的对数能量值x(m);步骤S20024:根据得到的对数能量值x(m)计算有效语音频谱的MFCC特征系数。对有效语音依次进行分帧和加汉明窗,得到分帧加窗的有效语音的步骤包括:根据预设帧长N和帧移对有效语音进行分帧,得到n帧分帧有效语音;将得到的n帧分帧有效语音均加汉明窗,汉明窗的数值W满足以下公式:其中,N为预设帧长,n为自然数。所述共振峰Hm(k)满足以下公式:其中,Hm(k)为有效语音频谱中频率为k的频谱通过第m个滤波器时的共振峰,f(m)为第m个滤波器对应的中心频率,m为自然数。所述对数能量值满足以下公式:对数能量值其中,x(m)为有效语音频谱通过第m个滤波器时的对数能量值,M为滤波器组中滤波器的个数,Hm(k)为有效语音频谱中频率为k的频谱通过第m个滤波器时的共振峰,X(k)为有效语音频谱中频率为k的频谱振幅,N为预设帧长,m为自然数;所述MFCC特征系数满足以下公式:MFCC特征系数其中,Xj为第K阶梅尔特征系数,M为滤波器组中滤波器的个数,N为预设帧长,x(m)为有效语音频谱通过第m个滤波器时的对数能量值,L为MFCC系数的阶数,L、j均为自然数。作为实施例:所述滤波器组为三角滤波器组,所述三角滤波器组包括若干个三角滤波器,滤波器的个数为26个。本专利技术通过对有效语音进行分帧,对每帧加汉明窗以减少频率的泄露,再对每帧进行FFT傅里叶变换,得到有效语音频谱,将有效语音频谱使用了26个三角滤波器,对每帧经过FFT傅里叶变换后的数据进行三角滤波以模拟人耳的掩蔽效应。最后对每帧进行DCT离散余弦变换即可得到每帧语音的MFCC梅尔特征系本文档来自技高网...

【技术保护点】
1.一种基于MFCC语音特征的语音匹配方法,其特征在于,包括以下步骤:获取有效语音的MFCC特征系数;将有效语音的MFCC特征系数与预设的若干MFCC特征系数依次进行匹配,得到若干MFCC特征系数对应的若干相似值;所述预设的若干MFCC特征系数为预设的若干命令词对应的MFCC特征系数;当某一相似值小于预设相似值时,则判断有效语音的MFCC特征系数与该相似值对应的MFCC特征系数匹配成功,并提取匹配成功的MFCC特征系数对应的命令词。

【技术特征摘要】
1.一种基于MFCC语音特征的语音匹配方法,其特征在于,包括以下步骤:获取有效语音的MFCC特征系数;将有效语音的MFCC特征系数与预设的若干MFCC特征系数依次进行匹配,得到若干MFCC特征系数对应的若干相似值;所述预设的若干MFCC特征系数为预设的若干命令词对应的MFCC特征系数;当某一相似值小于预设相似值时,则判断有效语音的MFCC特征系数与该相似值对应的MFCC特征系数匹配成功,并提取匹配成功的MFCC特征系数对应的命令词。2.根据权利要求1所述的基于MFCC语音特征的语音匹配方法,其特征在于,将有效语音的MFCC特征系数与预设的若干MFCC特征系数依次进行匹配的步骤具体包括将有效语音的MFCC特征系数与预设的若干MFCC特征系数依次通过DTW相似性算法进行匹配。3.根据权利要求1所述的基于MFCC语音特征的语音匹配方法,其特征在于,获取有效语音的MFCC特征系数的步骤具体包括:对有效语音依次进行分帧和加汉明窗,得到分帧加窗后的有效语音;对分帧加窗后的有效语音提取MFCC特征系数。4.根据权利要求3所述的基于MFCC语音特征的语音匹配方法,其特征在于,对分帧加窗后的有效语音提取MFCC特征系数的步骤具体包括:对分帧加窗后的有效语音进行FFT傅里叶变换,得到有效语音频谱;将有效语音频谱通过滤波器组进行,并计算通过滤波器组的有效语音频谱共振峰;根据得到的共振峰计算有效语音频谱的对数能量值x(m),根据得到的对数能量值x(m)计算有效语音频谱的MFCC特征系数。5.根据权利要求4所述的基于MFCC语音特征的语音匹配方法,其特征在于,对有效语音依次进行...

【专利技术属性】
技术研发人员:赵定金
申请(专利权)人:广州市保伦电子有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1