声纹识别方法、装置、移动终端及计算机可读存储介质制造方法及图纸

技术编号：23485611 阅读：20 留言：0更新日期：2020-03-10 12:53

本发明专利技术公开了一种声纹识别方法、装置、移动终端及计算机可读存储介质，所述声纹识别方法包括：获取声纹信息，并获取所述声纹信息的信噪比，将所述信噪比大于预设信噪比的声纹信息作为第一声纹信息，并基于所述第一声纹信息生成初始声纹识别模型，将所述信噪比小于或等于预设信噪比的声纹信息作为第二声纹信息，并基于所述第二声纹信息训练所述初始声纹识别模型，以生成目标声纹识别模型，提高了声纹识别模型的鲁棒性，进而提高了声纹识别模型识别的准确率。

Voiceprint recognition method, device, mobile terminal and computer readable storage medium

全部详细技术资料下载

【技术实现步骤摘要】
声纹识别方法、装置、移动终端及计算机可读存储介质
本专利技术涉及声纹识别领域，尤其涉及一种声纹识别方法、装置、移动终端及计算机可读存储介质。
技术介绍
现有声纹识别技术中，在仿真实验条件下，将声纹信息进行预处理，并进一步进行特征提取，对深度神经网络训练测试以得到声纹识别模型，然而实际应用场景中，背景条件的复杂不定以及各种噪声影响造成声纹识别模型识别准确率不高。上述内容仅用于辅助理解本专利技术的技术方案，并不代表承认上述内容是现有技术。
技术实现思路
本专利技术的主要目的在于提供一种声纹识别方法，旨在解决因采集的声纹信息中背景条件的复杂不定以及各种噪声影响造成声纹识别模型识别准确率不高的技术问题。为实现上述目的，本专利技术提供一种声纹识别方法，所述声纹识别方法包括以下步骤：获取声纹信息，并获取所述声纹信息的信噪比；将所述信噪比大于预设信噪比的声纹信息作为第一声纹信息，并基于所述第一声纹信息生成初始声纹识别模型；将所述信噪比小于或等于预设信噪比的声纹信息作为第二声纹信息，并基于所述第二声纹信息训练所述初始声纹识别模型，以生成目标声纹识别模型。优选地，将所述第一声纹信息依次经过预滤波、预加重、分帧加窗，以获得第一平稳声纹信息的多帧声纹；基于双门限端点检测法检测所述第一平稳声纹信息的多帧声纹，以获得第一有效声纹信息；提取所述第一有效声纹信息的第一声纹特征，并标识所述第一有效声纹信息；将所述第一声纹特征作为输入，所述第一有效声纹信息的标...

【技术保护点】
1.一种声纹识别方法，其特征在于，所述声纹识别方法包括以下步骤：/n获取声纹信息，并获取所述声纹信息的信噪比；/n将所述信噪比大于预设信噪比的声纹信息作为第一声纹信息，并基于所述第一声纹信息生成初始声纹识别模型；/n将所述信噪比小于或等于预设信噪比的声纹信息作为第二声纹信息，并基于所述第二声纹信息训练所述初始声纹识别模型，以生成目标声纹识别模型。/n

【技术特征摘要】
1.一种声纹识别方法，其特征在于，所述声纹识别方法包括以下步骤：
获取声纹信息，并获取所述声纹信息的信噪比；
将所述信噪比大于预设信噪比的声纹信息作为第一声纹信息，并基于所述第一声纹信息生成初始声纹识别模型；
将所述信噪比小于或等于预设信噪比的声纹信息作为第二声纹信息，并基于所述第二声纹信息训练所述初始声纹识别模型，以生成目标声纹识别模型。

2.如权利要求1所述的声纹识别方法，其特征在于，所述将所述信噪比大于预设信噪比的声纹信息作为第一声纹信息，并基于所述第一声纹信息生成初始声纹识别模型的步骤包括：
将所述第一声纹信息依次经过预滤波、预加重、分帧加窗，以获得第一平稳声纹信息的多帧声纹；
基于双门限端点检测法检测所述第一平稳声纹信息的多帧声纹，以获得第一有效声纹信息；
提取所述第一有效声纹信息的第一声纹特征，并标识所述第一有效声纹信息；
将所述第一声纹特征作为输入，所述第一有效声纹信息的标识作为输出，训练深度神经网络，以生成初始声纹识别模型。

3.如权利要求2所述的声纹识别方法，其特征在于，所述基于双门限端点检测法检测所述第一平稳声纹信息的多帧声纹，以获得第一有效声纹信息的步骤包括：
分别计算所述第一平稳声纹信息的多帧声纹的每一帧声纹的短时平均能量与短时平均过零率；
获取所述短时平均能量小于预设能量，且所述短时平均过零率大于预设过零率的有效帧声纹，并生成第一有效声纹信息。

4.如权利要求1所述的声纹识别方法，其特征在于，所述将所述信噪比小于或等于预设信噪比的声纹信息作为第二声纹信息，并基于所述第二声纹信息训练所述初始声纹识别模型，以生成目标声纹识别模型的步骤包括：
将所述第二声纹信息依次经过预滤波、预加重、分帧加窗，以获得第二平稳声纹信息的多帧声纹；
基于谱熵端点检测法检测所述第二平稳声纹信息的多帧声纹，以获得第二有效声纹信息；
提取所述第二有效声纹信息的第二声纹特征；
将所述第二声纹特征输入所述初始声纹识别模型，训练所述初始声纹识别模型，以生成目标声纹识别模型。

5.如权利要求4所述的声纹识别方法，其特征在于，所述基于谱熵端点检测法检测所述第二平稳声纹信息的多帧声纹，以获得第二有效声纹信息的步骤包括：<...

【专利技术属性】
技术研发人员：陈昊亮，许敏强，杨世清，
申请(专利权)人：广州国音智能科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人