一种多特征融合的声纹识别方法技术

技术编号:31504927 阅读:35 留言:0更新日期:2021-12-22 23:34
本发明专利技术公开了一种多特征融合的声纹识别方法,本发明专利技术不同于传统的特征融合方法,传统上会基于两种特征参数进行融合。而本方法提出将MFCC、LPC、PLP三种特征进行融合,并且选择带有主要信息的维度,尽管是三种特征参数,也没有导致维度过高的问题。本发明专利技术的融合特征参数具有多种类型语音特征参数各自的优势以及各自潜在的隐含信息,通过将不同的特征进行融合更能表现出说话人的个性特征,提高了声纹识别的准确率。的准确率。的准确率。

【技术实现步骤摘要】
一种多特征融合的声纹识别方法


[0001]本专利技术涉及语音信号处理、人工智能领域,特别涉及一种基于特征融合的声纹识别方法。

技术介绍

[0002]声纹识别又叫做说话人识别,是一种通过语音识别出说话人身份的技术,每个人的语音中所包含的特征信息有所不同,该特征信息就叫做声纹。声纹识别作为生物特征应用之一,与指纹识别、人脸识别有着同等重要的应用领域,且声纹识别具有采集方便、非接触性便利、造价低廉等优点。声纹识别可以应用在金融、智能锁、特定人唤醒等领域,随着应用范围的扩大,人们对声纹识别的要求也越来越高,提高声纹识别的性能也有着重要的意义。
[0003]声纹识别流程一般分为特征提取、模型构建、打分判决三个模块。特征提取是声纹识别的关键技术之一,目前常用的声纹特征有MFCC、Fbank、LPC、PLP等。当前主要选择单一特征参数,这样通常无法利用其它特征参数特有的信息,从而不能达到一个较好的效果。通过将不同特征进行融合,充分利用不同特征参数之间的信息,进而提升声纹识别的性能。

技术实现思路

[0004]本专利技术的目的是解决现有本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种多特征融合的声纹识别方法,其特征在于,该方法具体包括以下步骤:步骤一、准备语音数据并进行预处理;步骤二、提取12维的MFCC特征;步骤三、提取13维LPC特征;步骤四、提取13维PLP特征;步骤五、特征融合;将步骤二、步骤三、步骤四得到的特征在维度方向进行直接拼接,从而获得一种全面的特征参数。2.根据权利要求1所述的一种多特征融合的声纹识别方法,其特征在于:步骤一准备好语音数据并进行预处理,具体如下:utterMinLen=(frame*hop*window)*sr其中,frame代表帧长取180,hop代表帧移取0.01,window代表滑动窗口大小0.025,sr代表采样率取8000;最后得到语音时间序列的最小值,低于该值的语音序列直接舍去;然后对语音信号进行非静音间隔检测,将语音信号中的静音段排除,得到一个完整的非静音的...

【专利技术属性】
技术研发人员:周后盘赵将焜黄经州
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1