基于矢量量化和高斯混合模型的说话人识别系统技术方案

技术编号:18427979 阅读:43 留言:0更新日期:2018-07-12 02:22
本发明专利技术公开了一种基于矢量量化和高斯混合模型的说话人识别系统,该系统采用梅尔频率倒谱系数(MFCC)作为说话人的信息特征,对不同说话人的MFCC特征值建立高斯混合模型(GMM)和矢量量化(VQ)模型的混合模型系统,从而达到对说话人进行辨认或者确认的目的。

【技术实现步骤摘要】
基于矢量量化和高斯混合模型的说话人识别系统
本专利技术属于语音识别
,特别涉及基于矢量量化和高斯混合模型的说话人识别系统。
技术介绍
在说话人识别系统中特征提取是最重要的一环,特征提取表示从说话人的语音信号中提取出表示说话人个性的基本特征,目前在说话人识别中使用最多的特征是LPC倒谱系数、基音周期、MFCC、线性预测系数LPC等。从语音信号中提取到特征向量后,就需要针对特征向量建立匹配模型。目前根据各种特征而使用到的模式匹配方法包括概率统计方法、动态时间规整方法、VQ、GMM、人工神经网络方法等。VQ的优点是识别速度快,识别效果较好;GMM的优点不需要时间调整,可节约判决时的计算时间和存储量。
技术实现思路
本专利技术的目的是通过基于矢量量化和高斯混合模型的说话人识别系统,实现现实生活中安全访问、身份鉴定等应用场景里需要辨识使用人身份的实际需求,通过从说话人的一段语音中提取个人信息特征,然后对这些个人特征的分析和识别,从而达到对说话人进行辨认或者确认的目的。本系统包含训练阶段和识别阶段两个阶段。训练阶段:每一个说话人说出一段文字材料后获得的语音信号(定义为训练样本),对每一个训练样本文档来自技高网...

【技术保护点】
1.基于矢量量化和高斯混合模型的说话人识别系统,包括:训练阶段和识别阶段,其中:a1:训练阶段:每一个说话人说出一段文字材料后获得的语音信号(定义为训练样本),对每一个训练样本建立匹配模型,每一个说话者对应一个模型;a2:识别阶段:从待识人的语音数据(定义为测试样本)提取特征值,提取特征值中的参数与每一个匹配模型中的参数进行比较,通过每一个匹配模型计算得出待识别人的概率值,若某模型计算得的概率值最高并且该概率值高于给定阈值,则标签待识人为该模型的说话者。

【技术特征摘要】
1.基于矢量量化和高斯混合模型的说话人识别系统,包括:训练阶段和识别阶段,其中:a1:训练阶段:每一个说话人说出一段文字材料后获得的语音信号(定义为训练样本),对每一个训练样本建立匹配模型,每一个说话者对应一个模型;a2:识别阶段:从待识人的语音数据(定义为测试样本)提取特征值,提取特征值中的参数与每一个匹配模型中的参数进行比较,通过每一个匹配模型计算得出待识别人的概率值,若某模型计算得的概率值最高并且该概率值高于给定阈值,则标签待识人为该模型的说话者。2.根据权利要求1所述的基于矢量量化和高斯混合模型的说话人识别...

【专利技术属性】
技术研发人员:杨育斌沈金伟柯宗贵
申请(专利权)人:蓝盾信息安全技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1