【技术实现步骤摘要】
一种多特征融合的声纹识别方法
[0001]本专利技术涉及语音信号处理、人工智能领域,特别涉及一种基于特征融合的声纹识别方法。
技术介绍
[0002]声纹识别又叫做说话人识别,是一种通过语音识别出说话人身份的技术,每个人的语音中所包含的特征信息有所不同,该特征信息就叫做声纹。声纹识别作为生物特征应用之一,与指纹识别、人脸识别有着同等重要的应用领域,且声纹识别具有采集方便、非接触性便利、造价低廉等优点。声纹识别可以应用在金融、智能锁、特定人唤醒等领域,随着应用范围的扩大,人们对声纹识别的要求也越来越高,提高声纹识别的性能也有着重要的意义。
[0003]声纹识别流程一般分为特征提取、模型构建、打分判决三个模块。特征提取是声纹识别的关键技术之一,目前常用的声纹特征有MFCC、Fbank、LPC、PLP等。当前主要选择单一特征参数,这样通常无法利用其它特征参数特有的信息,从而不能达到一个较好的效果。通过将不同特征进行融合,充分利用不同特征参数之间的信息,进而提升声纹识别的性能。
技术实现思路
[0004]本专利 ...
【技术保护点】
【技术特征摘要】
1.一种多特征融合的声纹识别方法,其特征在于,该方法具体包括以下步骤:步骤一、准备语音数据并进行预处理;步骤二、提取12维的MFCC特征;步骤三、提取13维LPC特征;步骤四、提取13维PLP特征;步骤五、特征融合;将步骤二、步骤三、步骤四得到的特征在维度方向进行直接拼接,从而获得一种全面的特征参数。2.根据权利要求1所述的一种多特征融合的声纹识别方法,其特征在于:步骤一准备好语音数据并进行预处理,具体如下:utterMinLen=(frame*hop*window)*sr其中,frame代表帧长取180,hop代表帧移取0.01,window代表滑动窗口大小0.025,sr代表采样率取8000;最后得到语音时间序列的最小值,低于该值的语音序列直接舍去;然后对语音信号进行非静音间隔检测,将语音信号中的静音段排除,得到一个完整的非静音的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。