声纹识别方法、装置、移动终端及计算机可读存储介质制造方法及图纸

技术编号:23485611 阅读:20 留言:0更新日期:2020-03-10 12:53
本发明专利技术公开了一种声纹识别方法、装置、移动终端及计算机可读存储介质,所述声纹识别方法包括:获取声纹信息,并获取所述声纹信息的信噪比,将所述信噪比大于预设信噪比的声纹信息作为第一声纹信息,并基于所述第一声纹信息生成初始声纹识别模型,将所述信噪比小于或等于预设信噪比的声纹信息作为第二声纹信息,并基于所述第二声纹信息训练所述初始声纹识别模型,以生成目标声纹识别模型,提高了声纹识别模型的鲁棒性,进而提高了声纹识别模型识别的准确率。

Voiceprint recognition method, device, mobile terminal and computer readable storage medium

【技术实现步骤摘要】
声纹识别方法、装置、移动终端及计算机可读存储介质
本专利技术涉及声纹识别领域,尤其涉及一种声纹识别方法、装置、移动终端及计算机可读存储介质。
技术介绍
现有声纹识别技术中,在仿真实验条件下,将声纹信息进行预处理,并进一步进行特征提取,对深度神经网络训练测试以得到声纹识别模型,然而实际应用场景中,背景条件的复杂不定以及各种噪声影响造成声纹识别模型识别准确率不高。上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
本专利技术的主要目的在于提供一种声纹识别方法,旨在解决因采集的声纹信息中背景条件的复杂不定以及各种噪声影响造成声纹识别模型识别准确率不高的技术问题。为实现上述目的,本专利技术提供一种声纹识别方法,所述声纹识别方法包括以下步骤:获取声纹信息,并获取所述声纹信息的信噪比;将所述信噪比大于预设信噪比的声纹信息作为第一声纹信息,并基于所述第一声纹信息生成初始声纹识别模型;将所述信噪比小于或等于预设信噪比的声纹信息作为第二声纹信息,并基于所述第二声纹信息训练所述初始声纹识别模型,以生成目标声纹识别模型。优选地,将所述第一声纹信息依次经过预滤波、预加重、分帧加窗,以获得第一平稳声纹信息的多帧声纹;基于双门限端点检测法检测所述第一平稳声纹信息的多帧声纹,以获得第一有效声纹信息;提取所述第一有效声纹信息的第一声纹特征,并标识所述第一有效声纹信息;将所述第一声纹特征作为输入,所述第一有效声纹信息的标识作为输出,训练深度神经网络,以生成初始声纹识别模型。优选地,分别计算所述第一平稳声纹信息的多帧声纹的每一帧声纹的短时平均能量与短时平均过零率;获取所述短时平均能量小于预设能量,且所述短时平均过零率大于预设过零率的有效帧声纹,并生成第一有效声纹信息。优选地,将所述第二声纹信息依次经过预滤波、预加重、分帧加窗,以获得第二平稳声纹信息的多帧声纹;基于谱熵端点检测法检测所述第二平稳声纹信息的多帧声纹,以获得第二有效声纹信息;提取所述第二有效声纹信息的第二声纹特征;将所述第二声纹特征输入所述初始声纹识别模型,训练所述初始声纹识别模型,以生成目标声纹识别模型。优选地,对所述第二平稳声纹信息的多帧声纹分别进行快速傅里叶变换,以获得第二平稳声纹信息的每一帧声纹的功率谱;计算功率谱概率密度,并基于所述功率谱概率密度获取所述第二平稳声纹信息的每一帧声纹的谱熵值;获取所述谱熵值小于预设谱熵值的有效帧声纹,并生成第二有效声纹信息。优选地,对所述第二有效声纹信息进行快速傅里叶变换,以获得第二有效声纹信息的频谱,并根据所述频谱获取第二有效声纹信息的功率谱;采用梅尔刻度滤波器组处理所述第二有效声纹信息的功率谱,获取所述第二有效声纹信息的梅尔功率谱;在所述梅尔功率谱上进行倒谱分析,获取第二有效声纹信息的梅尔频率倒谱系数,并将所述梅尔频率倒谱系数确定为所述第二有效声纹信息的第二声纹特征。优选地,将所述第二声纹特征输入所述初始声纹识别模型,以获得第二声纹预测结果;获取所述第二声纹预测结果的偏差值,并基于所述偏差值修改所述初始声纹识别模型的模型参数,以获得目标声纹识别模型。本专利技术还提供一种声纹识别装置,所述声纹识别装置包括:获取模块,用于获取声纹信息,并获取所述声纹信息的信噪比;第一生成模块,用于将所述信噪比大于预设信噪比的声纹信息作为第一声纹信息,并基于所述第一声纹信息生成初始声纹识别模型;第二生成模块,用于将所述信噪比小于或等于预设信噪比的声纹信息作为第二声纹信息,并基于所述第二声纹信息训练所述初始声纹识别模型,以生成目标声纹识别模型。优选地,所述第一生成模块还用于:将所述第一声纹信息依次经过预滤波、预加重、分帧加窗,以获得第一平稳声纹信息的多帧声纹;基于双门限端点检测法检测所述第一平稳声纹信息的多帧声纹,以获得第一有效声纹信息;提取所述第一有效声纹信息的第一声纹特征,并标识所述第一有效声纹信息;将所述第一声纹特征作为输入,所述第一有效声纹信息的标识作为输出,训练深度神经网络,以生成初始声纹识别模型。优选地,所述第一生成模块还用于:分别计算所述第一平稳声纹信息的多帧声纹的每一帧声纹的短时平均能量与短时平均过零率;获取所述短时平均能量小于预设能量,且所述短时平均过零率大于预设过零率的有效帧声纹,并生成第一有效声纹信息。优选地,所述第二生成模块还用于:将所述第二声纹信息依次经过预滤波、预加重、分帧加窗,以获得第二平稳声纹信息的多帧声纹;基于谱熵端点检测法检测所述第二平稳声纹信息的多帧声纹,以获得第二有效声纹信息;提取所述第二有效声纹信息的第二声纹特征;将所述第二声纹特征输入所述初始声纹识别模型,训练所述初始声纹识别模型,以生成目标声纹识别模型。优选地,所述第二生成模块还用于:对所述第二平稳声纹信息的多帧声纹分别进行快速傅里叶变换,以获得第二平稳声纹信息的每一帧声纹的功率谱;计算功率谱概率密度,并基于所述功率谱概率密度获取所述第二平稳声纹信息的每一帧声纹的谱熵值;获取所述谱熵值小于预设谱熵值的有效帧声纹,并生成第二有效声纹信息。优选地,所述第二生成模块还用于:对所述第二有效声纹信息进行快速傅里叶变换,以获得第二有效声纹信息的频谱,并根据所述频谱获取第二有效声纹信息的功率谱;采用梅尔刻度滤波器组处理所述第二有效声纹信息的功率谱,获取所述第二有效声纹信息的梅尔功率谱;在所述梅尔功率谱上进行倒谱分析,获取第二有效声纹信息的梅尔频率倒谱系数,并将所述梅尔频率倒谱系数确定为所述第二有效声纹信息的第二声纹特征。优选地,所述第二生成模块还用于:将所述第二声纹特征输入所述初始声纹识别模型,以获得第二声纹预测结果;获取所述第二声纹预测结果的偏差值,并基于所述偏差值修改所述初始声纹识别模型的模型参数,以获得目标声纹识别模型。本专利技术还提供一种移动终端,所述移动终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的声纹识别程序,所述声纹识别程序被所述处理器执行时实现以上所述的声纹识别方法的步骤。本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有声纹识别程序,所述声纹识别程序被处理器执行时实现以上所述的声纹识别方法的步骤。本专利技术通过获取声纹信息,并获取声纹信息的信噪比,将信噪比大于预设信噪比的声纹信息作为第一声纹信息,并基于第一声纹信息生成初始声纹识别模型,将信噪比小于或等于预设信噪比的声纹信息作为第二声纹信息,并基于第二声纹信息训练初始声纹识别模型,以生成目标声纹识别模型,提高了声纹识别模型的鲁棒性,进而提高了声纹识别模型识别的准确率。附图说明图1是本专利技术实施例方案涉及的硬件运行环境的移动终端结构示意图;<本文档来自技高网...

【技术保护点】
1.一种声纹识别方法,其特征在于,所述声纹识别方法包括以下步骤:/n获取声纹信息,并获取所述声纹信息的信噪比;/n将所述信噪比大于预设信噪比的声纹信息作为第一声纹信息,并基于所述第一声纹信息生成初始声纹识别模型;/n将所述信噪比小于或等于预设信噪比的声纹信息作为第二声纹信息,并基于所述第二声纹信息训练所述初始声纹识别模型,以生成目标声纹识别模型。/n

【技术特征摘要】
1.一种声纹识别方法,其特征在于,所述声纹识别方法包括以下步骤:
获取声纹信息,并获取所述声纹信息的信噪比;
将所述信噪比大于预设信噪比的声纹信息作为第一声纹信息,并基于所述第一声纹信息生成初始声纹识别模型;
将所述信噪比小于或等于预设信噪比的声纹信息作为第二声纹信息,并基于所述第二声纹信息训练所述初始声纹识别模型,以生成目标声纹识别模型。


2.如权利要求1所述的声纹识别方法,其特征在于,所述将所述信噪比大于预设信噪比的声纹信息作为第一声纹信息,并基于所述第一声纹信息生成初始声纹识别模型的步骤包括:
将所述第一声纹信息依次经过预滤波、预加重、分帧加窗,以获得第一平稳声纹信息的多帧声纹;
基于双门限端点检测法检测所述第一平稳声纹信息的多帧声纹,以获得第一有效声纹信息;
提取所述第一有效声纹信息的第一声纹特征,并标识所述第一有效声纹信息;
将所述第一声纹特征作为输入,所述第一有效声纹信息的标识作为输出,训练深度神经网络,以生成初始声纹识别模型。


3.如权利要求2所述的声纹识别方法,其特征在于,所述基于双门限端点检测法检测所述第一平稳声纹信息的多帧声纹,以获得第一有效声纹信息的步骤包括:
分别计算所述第一平稳声纹信息的多帧声纹的每一帧声纹的短时平均能量与短时平均过零率;
获取所述短时平均能量小于预设能量,且所述短时平均过零率大于预设过零率的有效帧声纹,并生成第一有效声纹信息。


4.如权利要求1所述的声纹识别方法,其特征在于,所述将所述信噪比小于或等于预设信噪比的声纹信息作为第二声纹信息,并基于所述第二声纹信息训练所述初始声纹识别模型,以生成目标声纹识别模型的步骤包括:
将所述第二声纹信息依次经过预滤波、预加重、分帧加窗,以获得第二平稳声纹信息的多帧声纹;
基于谱熵端点检测法检测所述第二平稳声纹信息的多帧声纹,以获得第二有效声纹信息;
提取所述第二有效声纹信息的第二声纹特征;
将所述第二声纹特征输入所述初始声纹识别模型,训练所述初始声纹识别模型,以生成目标声纹识别模型。


5.如权利要求4所述的声纹识别方法,其特征在于,所述基于谱熵端点检测法检测所述第二平稳声纹信息的多帧声纹,以获得第二有效声纹信息的步骤包括:<...

【专利技术属性】
技术研发人员:陈昊亮许敏强杨世清
申请(专利权)人:广州国音智能科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1