一种基于GMM模型的语音激活检测方法技术

技术编号:16155302 阅读:49 留言:0更新日期:2017-09-06 19:31
本发明专利技术主要披露了一种基于GMM模型的语音激活检测方法,包括以下操作:数据训练:建立训练样本库和用EM核心算法分别训练语音信号GMM模型、噪声信号GMM模型;数据测试:对实时通话进行检测,包括:分帧处理、特征提取、概率计算;数据判断:根据语音信号概率

【技术实现步骤摘要】
一种基于GMM模型的语音激活检测方法
本专利技术属于音频处理
,尤其涉及VoIP通讯过程的音频处理技术。
技术介绍
随着VoIP及视频会议技术的不断发展创新,VoIP、视频会议已成为公司日常工作沟通和交流的重要手段,因此长时间的视频会议,语音会议司空见惯。在会议间隙不免可能会有长时间的资料整理,录入,调试等工作,这段时间没有人说话,但是由于与会者离VoIP终端较近,会导致对端听到键盘敲击声,纸张翻阅,或者其他的的较大的噪声,对对端造成干扰。为了避免上述尴尬的发生,本专利技术提出一种语音激活检测方法,其对语音通话中特定噪声检测并做相应处理,当有人重新说话时,则开启正常通话模式。现有的语音激活检测方法,大多只能区别比较小的背景噪音与语音,对于键盘敲击等特定的较大的噪声,则无法判别。本专利技术提出基于对语音信号和特定噪声分别用GMM(GaussianMixtureModel,高斯混合模型)训练模型并用于检测区别语音信号与特定噪声的语音激活检测方法。
技术实现思路
本专利技术的目的在于提供一种基于GMM模型的语音激活检测方法,为了实现在VoIP通话过程中在无人说话时对特定的噪声信号进行噪声本文档来自技高网...
一种基于GMM模型的语音激活检测方法

【技术保护点】
一种基于GMM模型的语音激活检测方法,其特征在于,所述方法包括以下操作:数据训练:建立训练样本库和用EM核心算法分别训练语音信号GMM模型、噪声信号GMM模型;数据测试:对实时通话进行检测,包括:分帧处理、特征提取、概率计算;数据判断:根据所述语音信号概率

【技术特征摘要】
1.一种基于GMM模型的语音激活检测方法,其特征在于,所述方法包括以下操作:数据训练:建立训练样本库和用EM核心算法分别训练语音信号GMM模型、噪声信号GMM模型;数据测试:对实时通话进行检测,包括:分帧处理、特征提取、概率计算;数据判断:根据所述语音信号概率及所述噪声信号概率判断测试帧信号为语音信号还是噪声信号。2.根据权利要求1所述的语音激活检测方法,其特征在于,所述数据训练进一步包括:步骤1-a:收集语音信号样本集和噪声信号样本集,对所述语音信号样本集和所述噪声信号样本集中的音频文件分别进行分帧,语音帧信号集记为,噪声帧信号集记为;步骤1-b:提取用于GMM训练的特征集,即对所述语音帧信号集提取的语音特征集记为,对所述噪声帧信号集提取的噪声特征集记为;步骤1-c:对所述语音特征集、所述噪声特征集进行GMM训练,分别得到:语音模型GMM参数集、噪声模型GMM参数集。3.根据权利要求2所述的语音激活检测方法,其特征在于,所述数据测试包括:步骤2-a:对测试信号分帧处理;步骤2-b:对所述测试信号提取用于GMM测试的特征集,记为测试特征集;步骤2-c:分别计算所述语音信号概率和所述噪声信号概率。4.根据权利要求3所述的语音激活检测方法,其特征在于,所述语音信号的概率是根据所述测试特征集和所述语音模型GMM参数集计算所得;所述噪声信号概率是根据所述测试特征集和所述噪声模型GMM参数集计算所得。5.根据权利要求4所述的语音激活检测方法,其特征在于,所述语音帧信号集包含10ms长度的帧语音信号;所述噪声帧信号集包含10ms长度的帧噪声信号,为语音信号帧总数以及噪声信号帧总数。6.根据权利要求5所述的语音激活检测方法,其特征在于,所述语音特征集包括所有语音帧信号提取的特征集集合,是对中的每一帧...

【专利技术属性】
技术研发人员:羊开云高可攀韩翀蛟徐晓峰李夏宾
申请(专利权)人:深圳市潮流网络技术有限公司潮流网络有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1