一种声纹识别方法、装置、设备及存储介质制造方法及图纸

技术编号:27529527 阅读:86 留言:0更新日期:2021-03-03 11:04
本发明专利技术公开了一种声纹识别方法、装置、设备及存储介质,该方法包括:获取用户的包含登录指令待识别的音频数据,输入声纹提取模型,输出声学特征;将所述声学特征输入已训练的声纹识别模型,输出识别文本;根据预先存储的验证音频数据对所述识别文本进行识别,以识别用户身份;响应于所述用户身份识别成功,执行所述登录执行。本发明专利技术针对如何解决由于传统声纹识别算法的局限性,通过获取用户的包含登录指令待识别的音频数据,输入声纹提取模型,输出声学特征;将所述声学特征输入已训练的声纹识别模型,输出识别文本;根据预先存储的验证音频数据对所述识别文本进行识别,以识别用户身份,提高音频数据进行登录验证的准确率。提高音频数据进行登录验证的准确率。提高音频数据进行登录验证的准确率。

【技术实现步骤摘要】
一种声纹识别方法、装置、设备及存储介质


[0001]本专利技术涉及一种声纹识别方法、装置、设备及存储介质,属于声音识别


技术介绍

[0002]现有的智能终端的登录验证方式仅仅依靠原有的密码验证不能满足多重验证的需要,因此声音验证方式被引入智能终端的登录验证场景中。
[0003]由于传统声纹识别算法的局限性,要取得较理想的声纹识别准确率必须对有效长语音进行识别,而在声纹识别的实际应用中,用户讲话习惯决定用户的录音往往达不到有效长语音的要求,因而实际场景下的声纹识别准确率相对较低,在某些特定场景下甚至无法达到可应用的最低要求。

技术实现思路

[0004]本专利技术的目的在于,克服现有技术存在的技术缺陷,解决上述技术问题,提出一种声纹识别方法、装置、设备及存储介质。
[0005]本专利技术具体采用如下技术方案:一种声纹识别方法,所述方法包括:
[0006]获取用户的包含登录指令待识别的音频数据,输入声纹提取模型,输出声学特征;
[0007]将所述声学特征输入已训练的声纹识别模型,输出识别文本;本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种声纹识别方法,其特征在于,所述方法包括:获取用户的包含登录指令待识别的音频数据,输入声纹提取模型,输出声学特征;将所述声学特征输入已训练的声纹识别模型,输出识别文本;根据预先存储的验证音频数据对所述识别文本进行识别,以识别用户身份;响应于所述用户身份识别成功,执行所述登录执行。2.根据权利要求1所述的一种声纹识别方法,其特征在于,所述声纹提取模型的训练方法包括:获取用户在T个设备上的语音数据,并基于所述语音数据,提取声学特征,构建训练数据集合,T为大于等于2的正整数;将所述训练数据集合输入到所述神经网络模型中,对所述神经网络模型进行训练,并获取所述神经网络模型每次训练的损失函数;当所述损失函数收敛时,确定所述神经网络模型训练完成;其中,所述损失函数为分类损失函数、重构损失函数、差异损失函数和相似性损失函数的加权和。3.根据权利要求1所述的一种声纹识别方法,其特征在于,所述声纹识别模型的训练方法包括:获取待识别用户的历史验证音频数据,输入声纹提取模型,输出历史验证音频数据的声学特征;将所述历史验证音频数据的声学特征输入已训练的声纹识别模型,并基于识别分类误差信息对所述声纹识别模型进行训练。4.根据权利要求3所述的一种声纹识别方法,其特征在于,所述声纹识别模型包括池化层,所述池化层为不同语音帧设置不同的权重;所述池化层包括神经网络;所述基于识别分类误差信息对所述声纹识别模型进行训练包括:基于所述识别分类误差信息与预定误差阈值对所述神经网络的参数进行调整,以为输入所述池化层的不同语音帧设置不同的权重;响应于所述识别分类误差信息小于等于预定误差阈值,所述声纹识别模型训练完成。5.一种声纹识别装置,其特征在于,包括:声纹提取模块,用于执行:获取用户的包含登录指令待识别的音频数据,输入声纹提取模型,输出声学特征;声纹识别模块,用于执行:将所述声学特征输入已训练的声纹...

【专利技术属性】
技术研发人员:张震石瑾李鹏李沁黄远沈亮李娅强
申请(专利权)人:国家计算机网络与信息安全管理中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1