声纹识别方法、系统、存储介质及电子设备技术方案

技术编号:27979652 阅读:31 留言:0更新日期:2021-04-06 14:14
本申请涉及声纹识别技术领域,具体涉及一种声纹识别方法、系统、存储介质及电子设备,解决了相关技术中由于采用固定感受野的方形卷积导致最终声纹识别效果较差的问题。该方法包括:通过预先训练完成的卷积神经网络模型提取语音信息中的待验证声纹特征;卷积神经网络模型由包括可变形卷积层的卷积神经网络训练得到;比较待验证声纹特征与注册声纹特征的相似度,判断相似度结果是否大于预设阈值,若判定相似度结果大于预设阈值,则声纹识别成功。通过加入可变形卷积层的卷积神经网络提取声纹特征,实现对不同的声纹特征进行自适应的感受野改变,使最终得到的卷积神经网络模型具有更高的鲁棒性,提升声纹识别精度。

【技术实现步骤摘要】
声纹识别方法、系统、存储介质及电子设备
本申请涉及声纹识别
,特别地涉及一种声纹识别方法、系统、存储介质及电子设备。
技术介绍
声纹识别,是一种基于语音进行身份认证的技术,属于生物特征识别的一种。声纹识别的应用领域非常广泛,并将随着智能语音技术的发展而不断推广普及。近年来,深度学习的应用开始成为声纹识别领域的热点,得益于大量有标签的音频数据,采用深度卷积神经网络建模的声纹识别系统表现出很大的识别性能提升。目前采用的深度卷积神经网络建模的声纹识别方法中,卷积神经网络的卷积核会对输入特征的局部区域进行卷积操作,采用的是传统的方形卷积,只能对固定的方形区域内的声纹特征进行采样,无法对不同的声纹特征进行自适应的感受野改变,导致最终的声纹识别效果较差。
技术实现思路
针对上述问题,本申请提供一种声纹识别方法、系统、存储介质及电子设备,解决了相关技术中由于采用固定感受野的方形卷积导致最终声纹识别效果较差的技术问题。第一方面,本申请提供了一种声纹识别方法,所述方法包括:接收语音信息;>通过预先训练完成的本文档来自技高网...

【技术保护点】
1.一种声纹识别方法,其特征在于,所述方法包括:/n接收语音信息;/n通过预先训练完成的卷积神经网络模型提取所述语音信息中的待验证声纹特征;所述预先训练完成的卷积神经网络模型由包括可变形卷积层的卷积神经网络训练得到;/n比较所述待验证声纹特征与预先完成注册的注册声纹特征的相似度,得到相似度结果;/n判断所述相似度结果是否大于预设阈值,若判定所述相似度结果大于预设阈值,则声纹识别成功。/n

【技术特征摘要】
1.一种声纹识别方法,其特征在于,所述方法包括:
接收语音信息;
通过预先训练完成的卷积神经网络模型提取所述语音信息中的待验证声纹特征;所述预先训练完成的卷积神经网络模型由包括可变形卷积层的卷积神经网络训练得到;
比较所述待验证声纹特征与预先完成注册的注册声纹特征的相似度,得到相似度结果;
判断所述相似度结果是否大于预设阈值,若判定所述相似度结果大于预设阈值,则声纹识别成功。


2.根据权利要求1所述的方法,其特征在于,所述比较所述待验证声纹特征与预先完成注册的注册声纹特征的相似度,得到相似度结果,包括:
通过余弦计算方法计算所述待验证声纹特征与预先完成注册的注册声纹特征的相似度,得到相似度结果。


3.根据权利要求1所述的方法,其特征在于,所述注册声纹特征的注册过程包括:
接收注册语音信息;
通过预先训练完成的卷积神经网络模型提取所述注册语音信息中的注册声纹特征;所述预先训练完成的卷积神经网络模型由包括可变形卷积层的卷积神经网络训练得到。


4.根据权利要求1所述的方法,其特征在于,所述卷积神经网络模型的训练过程包括:
建立卷积神经网络;所述卷积神经网络包括依次排列的第一卷积层、第一池化层、可变形卷积层、第二池化层、第二卷积层、全连接层;所述第一卷积层包括第一子卷积层和第二子卷积层,所述可变形卷积层包括第一子可变形卷积层和第二子可变形卷积层;
将预先完成标记的训练声纹特征作为输入...

【专利技术属性】
技术研发人员:张鹏吴伟李明杰詹培旋王彬
申请(专利权)人:珠海格力电器股份有限公司珠海联云科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1