一种应用于语种识别的鉴别性特征提取方法技术

技术编号:14410151 阅读:180 留言:0更新日期:2017-01-11 20:36
本发明专利技术涉及一种应用于语种识别的鉴别性特征提取方法,包括:在训练阶段为训练集中的语音数据的帧级的音素后验概率特征向量计算F比指标,所述F比指标反映了音素后验概率特征向量中每一维对语种鉴别性的贡献大小;在测试阶段为待测试的语音提取音素后验概率特征向量,并为所提取的音素后验概率特征向量根据F比指标做特征加权。

【技术实现步骤摘要】

本专利技术涉及计算机语种识别领域,特别涉及一种应用于语种识别的鉴别性特征提取方法
技术介绍
语种识别是指计算机自动判定或确认一段语音所属的语言种类的技术。这是个可使大规模跨语言语音识别应用成为可能的技术,可用于口语语言翻译、口语文件检索等。同时也是智能与安全领域信息提取的研究热点。语种识别技术的关键在于用科学的方法来度量不同语言的个性。认知学的实验表明,语言之间的差异可以由不同层次的特征反映出来,包括声学层特征、音素层特征、韵律特征、词法特征和句法特征。声学层特征通常从原始语音直接提取,常用的有美尔倒谱系数(MFCC)、线性预测倒谱系数(LPCC)和感知器线性预测(PLP)等。考虑语音帧前后间的相互关系,通常要对特征进行差分变换,例如一阶差分,二阶差分等。音素层特征主要考虑了各语言间的音节和音素不完全相同、音节和音素出现频率的差异,以及音节和音素出现前后关系的不同作为识别依据。目前的语种识别系统大部分都基于声学层特征和音素层特征。近年来,受益于信号处理、模式识别与机器学习等相关领域的科技突破,语种识别特征研究已取得了长足的进步,但仍有很多地方需要改进与进一步研究。参考文献[1](本文档来自技高网...
一种应用于语种识别的鉴别性特征提取方法

【技术保护点】
一种应用于语种识别的鉴别性特征提取方法,包括:在训练阶段为训练集中的语音数据的帧级的音素后验概率特征向量计算F比指标,所述F比指标反映了音素后验概率特征向量中每一维对语种鉴别性的贡献大小;在测试阶段为待测试的语音提取音素后验概率特征向量,并为所提取的音素后验概率特征向量根据F比指标做特征加权。

【技术特征摘要】
1.一种应用于语种识别的鉴别性特征提取方法,包括:在训练阶段为训练集中的语音数据的帧级的音素后验概率特征向量计算F比指标,所述F比指标反映了音素后验概率特征向量中每一维对语种鉴别性的贡献大小;在测试阶段为待测试的语音提取音素后验概率特征向量,并为所提取的音素后验概率特征向量根据F比指标做特征加权。2.根据权利要求1所述的应用于语种识别的鉴别性特征提取方法,其特征在于,该方法包括:训练阶段:步骤101)、去除训练集中各段语音数据的非语音部分;其中,所述非语音部分包括静音段、噪声段;步骤102)、将经过步骤101)处理的训练集中各段语音数据做音素识别,得到各段语音数据的帧级的音素后验概率特征向量;步骤103)、对步骤102)所得到的各段语音数据的帧级的音素后验概率特征向量分别进行规整;步骤104)、计算规整后的音素后验概率特征向量中每一维对语种鉴别性的贡献大小,得到F比指标的值;步骤105)、在步骤104)所得到的规整后的音素后验概率特征向量中每一维的F比指标值的基础上,设定用于描述规整后音素后验概率特征向量每一维对语种鉴别性的贡献大小的权重;所述权重的计算表达式如下:w(k)=x×F-Ratio(k)其中,w(k)为规整后音素后验概率特征向量第k维对语种鉴别性的贡献大小的权重,F-Ratio(k)为规整后的音素后验概率特征向量第k维的F-Ratio值,参数x为经过实验得到的经验值;测试阶段:步骤201)、去除待测试语音数据中的非语音部分;步骤202)、对经过步骤201)处理的待测试语音数据做音素识别,得到该待测
\t试语音数据的帧级的音素后验概率特征向量;步骤203)、对步骤202)所得到的每一帧的音素后验概率特征向量进行规整;步骤204)、根据训练阶段为规整后音素后验概率特征向量每一维赋予的权重,为步骤203)所得到的规整后音素后验概率特征向量做加权。3.根据权利要求2所述的应用于语种识别的鉴别性特征提取方法,其特征在于,该方法在训练阶段还包括:步骤106)、由步骤105)所得到的权重为步骤103)得...

【专利技术属性】
技术研发人员:袁庆升周若华云晓春张健陈训逊颜永红徐杰李锐光
申请(专利权)人:国家计算机网络与信息安全管理中心中国科学院声学研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1