【技术实现步骤摘要】
本专利技术涉及生物特征识别领域,特别地,涉及一种说话人识别方法和系统。
技术介绍
说话人识别(Speaker Recognition),是一项根据语音波形中反映说话人生 理和行为特征的语音参数,自动识别说话人身份的技术。说话人识别可以看作 是语音识别的一种。它和语音识别一样,都是通过对所收到的语音信号进行处 理,提糾目应的特征或者建立相应的模型,然后据此做出判断。说话人识别与 语音识别的区别在于,它并不注意语音信号中的语义内容,而是希望从语音信 号中提取出人的特征;而语音识别是企求从不同人的词语信号中寻找共同因 素,对不同人i兌话的差别加以归一化。图1示出了现有技术中说话人识別系统的结构框图,建立和应用这一系统 可分为两个阶段,即训练阶段和识别阶段。在训练阶段,系统为参考语音信号 建立模板,而在识别阶段,系统将待识别的语音信号特征与参考模板特征进行 比较,并且一艮据一定的相似性准则形成判断。种方式都是根据语音信号中体现的说话人特征进行说话人识别。与文本无 关,,,是采用随机说话文本内容,但是这种方法需要训练数据足够充足,而在 实际应用中,这点往往不能得到满足, ...
【技术保护点】
一种说话人识别的方法,其特征在于,所述方法包括以下步骤: 获取待识别说话人的语音信号; 提取所述语音信号中的基音特征参量、倒谱特征参量及功率谱特征参量; 将所述基音特征参量、倒谱特征参量及功率谱特征参量与特征模板中预置的相 应语音信号的特征参量分别进行匹配,获取待识别语音信号的综合匹配失真值及综合匹配路径偏差; 根据所述综合匹配失真值及综合匹配路径偏差,获取待识别语音信号的最终比对误差; 如果所述最终比对误差低于预设综合匹配对比阈值,则确认该说话人 。
【技术特征摘要】
1、一种说话人识别的方法,其特征在于,所述方法包括以下步骤获取待识别说话人的语音信号;提取所述语音信号中的基音特征参量、倒谱特征参量及功率谱特征参量;将所述基音特征参量、倒谱特征参量及功率谱特征参量与特征模板中预置的相应语音信号的特征参量分别进行匹配,获取待识别语音信号的综合匹配失真值及综合匹配路径偏差;根据所述综合匹配失真值及综合匹配路径偏差,获取待识别语音信号的最终比对误差;如果所述最终比对误差低于预设综合匹配对比阈值,则确认该说话人。2、 根据权利要求1所述的方法,其特征在于,所述待识别说话人的语音 信号是说话人按照特征模板中预置文本内容发音的信号。3、 根据权利要求1所述的方法,其特征在于,所述获取待识别语音信号 的综合匹配失真值的步骤具体包括分别将各个待识别特征参量与特征模板中预置的相应语音信号的特征参 量分别进行匹配,获取各待识别特征参量的匹配失真值;对各个待识别特征参量的匹配失真值进行加权,得到待识别语音信号的综 合匹配失真值。4、 根据权利要求1所述的方法,其特征在于,所述获取待识别语音信号 的综合匹配路径偏差的步骤具体包括将特征模板中预置的语音信号变换成为预置数字语音信号采样帧序列; 将待识别的语音信号按照相同的采样间隔变换成为待识别数字语音信号 采样帧序列;将待识别数字语音信号采样帧序列中的各帧依次与预置数字语音信号采 样帧序列中的相应帧进行各个特征参量匹配,得到各个特征参量匹配路径; 计算各个特征参量匹配路径每二者之间的路径偏差,获取综合匹配路径偏差。5、 根据权利要求1所述的方法,其特征在于,所述最终比对误差是由所 述综合匹配失真值及综合匹配路径偏差之间的乘积得到。6、 一种说话人识别的系统,其特征在于,所述系统包括 取样模块,用于获取待识别说话人的语音信号;提取特征模块,用于提取所述待识别的语音信号中包含的基音特征参量...
【专利技术属性】
技术研发人员:张晨,冯宇红,邓昊,
申请(专利权)人:北京中星微电子有限公司,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。