一种基于主成分GFCC与声道振动频谱参数的语种识别方法技术

技术编号：35901137 阅读：14 留言：0更新日期：2022-12-10 10:37

本发明专利技术涉及一种基于主成分GFCC与声道振动频谱参数的语种识别方法，属于语音识别技术领域。本发明专利技术在训练阶段首先在低信噪比下基于Fisher准则对伽玛通频率倒谱系数各维特征进行分析比较，筛选出最具有识别度的五维作为主成分伽玛通频率倒谱系数，再基于信号倒谱提取声道振动特征参数，将两种特征进行融合得到融合特征集，最后将融合特征集输入到语种识别模型中训练出对应语种识别模型。在识别阶段对要识别的语音提取融合特征并与训练好的语种模型进行打分判决，最后输出识别结果。经过测试，本发明专利技术可以提高语种识别在低信噪比环境下准确率，且运行速度快，计算量少。计算量少。计算量少。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于主成分GFCC与声道振动频谱参数的语种识别方法

[0001]本专利技术涉及一种基于主成分GFCC与声道振动频谱参数的语种识别方法，属于语音识别

技术介绍

[0002]随着经济全球化的发展以及科技的进步，全球各地区各民族之间的交流变得更加频繁与密切，因此语种识别问题也越来越被重视。全球各地区各民族之间要进行交流不仅仅满足于通过文字与翻译软件，而是非常需要以一种更加自然、更加智能方便的方式进行交流，因此将语音传入计算机相比于传统的打字交流越来越普遍，越来越多的工程项目或者是设备加入了语音控制模块，让机器能够听懂人话，或者说用语音控制机器是最方便的，也是一直以来的一个备受关注的研究课题。要用语音控制机器，最基础的也是最开始的一步就是要让机器判断出所说的语言是什么，才能正确识别语音的指令并进行后续操作。目前，语种识别技术已经大量运用在军事以及多语种信息服务行业。语种识别在纯净或者小噪声环境下的识别率已经很好，但是现实环境中很少有不含噪声的环境，所以低信噪比下的语种识别率还需要提升。

技术实现思路

[0003]本专利技术要解决的技术问题是提供一种基于主成分GFCC与声道振动频谱参数的语种识别方法，用来解决在低信噪比环境下语种识别率低的问题，减小噪声对语种识别的硬性，提高识别率。
[0004]本专利技术在低信噪比下基于Fisher准则对伽玛通频率倒谱系数各维特征进行分析比较，筛选出最具有识别度的五维作为主成分伽玛通频率倒谱系数，再基于信号倒谱提取声道振动特征参数，最后将特征融合后通过高斯...

【技术保护点】

【技术特征摘要】
1.一种基于主成分GFCC与声道振动频谱参数的语种识别方法，其特征在于：Step1：获取语料集数据；Step2：对语料集数据中的每条语音进行GFCC系数提取；Step3：根据Fisher准则计算分析在低信噪比环境下传统13维静态GFCC特征每一维的贡献度，并将贡献度最高的5维组成主成分伽玛通频率倒谱系数；Step4：对每条语音提取其声道振动频谱参数；Step5：对提取的语音PCGFCC特征融合提取的语音的声道振动频谱特征；Step6：将提取的融合特征集输入到语种识别模型训练，生成对应的语种识别模型；Step7：将要识别的语音输入语种识别系统，提取其融合特征并与提取出来的语种模型进行对比判决打分，最后输出识别结果。2.根据权利要求1所述的基于主成分GFCC与声道振动频谱参数的语种识别方法，其特征在于，所述Step1具体为：Step1.1：从数据库中获取不同语种的广播音频；Step1.2：用获取的纯净语音合成带噪语音以供检测。3.根据权利要求1所述的基于主成分GFCC与声道振动频谱参数的语种识别方法，其特征在于，所述Step2具体为：Step2.1：对语音进行预处...

【专利技术属性】
技术研发人员：邵玉斌，张昊阁，周大春，段云，
申请(专利权)人：昆明理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人