说话人识别方法及系统技术方案

技术编号：6926489 阅读：228 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及身份识别技术领域，公开了一种说话人识别方法及系统，该方法包括：采集不同信道下的用户注册语音信号；从采集的所述语音信号中分别提取声纹特征序列；利用所述声纹特征序列训练生成对应所述用户的说话人模型；根据所述说话人模型及预先训练生成的通用背景模型对所述用户进行说话人识别。本发明专利技术说话人识别方法及系统，可以适应不同的信道环境，提高系统性能。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及身份识别
，特别涉及一种说话人识别方法及系统。
技术介绍
说话人识别即根据采集到的语音信号判断说话人身份，该技术主要有两个方面的应用，即说话人确认和说话人识别。说话人确认是指判断当前输入语音是否为其申明的目标说话人的发音，属于一对一的判断问题；而说话人识别是指从目标说话人集合中选定对应于当前语音输入的发音人，属于一对多的模型辨识问题。说话人识别技术在军事、国家安全、刑侦领域和银行、证券等金融领域有着广泛的应用。目前说话人识别最为主流的技术路线是GMM-UBM算法，即分别采用混合高斯模型 (Gaussian Mixture Model, GMM)模拟各说话人模型及单独的通用背景模型(Universal Background Model, UBM)，通过比较说话人模型及背景模型相对于输入语音信号的声纹特征的似然比确定说话人身份。具体地，在进行说话人确认时根据说话人模型及背景模型的似然比和预置阈值的大小判断是否为目标说话人，而在进行说话人识别时则比较所有说话人模型的似然比大小并选择具有最大似然比的说话人为识别结果。通常，对说话人模型的模拟效果会随着训练数据量的增多而得到进一步的改善，从而使说话人识别系统的性能得到提高。然而在实际应用中，实际检测环境和模型训练环境往往不尽相同，语音通信中通信信道或通信工具的任何变化都会引起语音信号不同程度的畸变，进而导致训练数据和测试采集信道不匹配，训练模型不能很好地模拟测试数据，影响了系统性能。因此，如何改善说话人识别系统在不同信道环境下的识别稳定性，提高该系统的鲁棒性和普适性已成为当前亟待解决的实际问...

【技术保护点】
１．一种说话人识别方法，其特征在于，包括：采集不同信道下的用户注册语音信号；从采集的所述语音信号中分别提取声纹特征序列；利用所述声纹特征序列训练生成对应所述用户的说话人模型；根据所述说话人模型及预先训练生成的通用背景模型对所述用户进行说话人识别。

【技术特征摘要】

【专利技术属性】
技术研发人员：柳林，魏思，胡国平，胡郁，何婷婷，吴晓如，刘庆峰，
申请(专利权)人：安徽科大讯飞信息科技股份有限公司，
类型：发明
国别省市：34

全部详细技术资料下载我是这个专利的主人