【技术实现步骤摘要】
一种集成决策的汉语方言辨识方法
[0001]本专利技术涉及汉语方言辨识领域,具体为一种集成决策的汉语方言辨识方法。
技术介绍
[0002]目前语言辨识的主流技术是Zissman提出的音素识别语言模型(PPRLM)方法,但该方法需要对语音库的语音数据进行标注,大规模的标注是个长期的工程,且在一般条件下难以实现。针对这个问题Torres
‑
Carrasquillo提出了以GMM符号化代替音素识别的改进方法,该方法可以在不用标注语音训练样本的情况下,取得与PPRLM方法接近的辨识率。由于我国是个多方言的民族,方言数据比较难得,且不易对方言进行标注的特点,所以该方法也被成功应用汉语方言辨识系统中,并且取得了较好的识别效果。但必须指出的是,该系统的辨识精度与高斯混合模型的阶数密切相关,阶数越高,系统描述能力越强,辨识的精度越高。但是,参数越多系统越复杂,所需训练样本也越多,这在样本受限情况下是件困难的事情。
技术实现思路
[0003]为了解决上述问题,本专利技术提供一种集成决策的汉语方言辨识方法,克服 ...
【技术保护点】
【技术特征摘要】
1.一种集成决策的汉语方言辨识方法,其特征在于,包括以下步骤:1)预处理包括有声与无声判别、预加重、分段和加窗;2)特征提取包括美尔倒谱MFCC计算和转移倒谱特征SDC计算以及在此基础上进行的全局语言特征的提取;3)GMM符号化设语音信号经预处理和特征提取后为设语音信号经预处理和特征提取后为是第t帧的语音特征矢量,T为该语音段总的帧数,则该语音段在第k个方言GMM模型下的输出概率为:其中,表示第k个方言的GMM符号化模型,表示该模型第j个高斯混合分量的加权值,分别表示该模型第j个高斯混合分量的均值和协方差矩阵,j=1,
…
,M,M为高斯混合元数目,也是符号总数;4)N
‑
元语言模型设经过第k个GMM模型下得到的语音符号串为:设经过第k个GMM模型下得到的语音符号串为:表示第k个GMM模型下,第t帧语音的符号,t=1,2,
…
,T,k=1,2,
…
,N,N表示方言总数,T为总的语音帧数,则它在第i个方言语言模型下得到的对数似然为:其中,为第i个方言语言模型;5)集成分类该步骤采用Bagging和AdaBoost两种典型的集成学习算法,先进行Bagging算法,再进行AdaBoost算法;Bagging算法,步骤如下:(1)设T为样本集的个数,每个样本集含有M个样本;(2) For t =1,2,
…
,T do在每个样本集上训练一个基分类器h
t
(3)End for;(4)H(x)=argmax∑
t
δ(h
t
(x)=y);如果参数为真δ(
·
)=1,否则δ(
·
)=0;AdaBoost算法:设训练模式矢量为其中,是第m个样本的特征矢量,y
m
...
【专利技术属性】
技术研发人员:夏玉果,
申请(专利权)人:江苏信息职业技术学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。