声纹识别方法及装置、计算机可读存储介质、终端制造方法及图纸

技术编号:36346502 阅读:79 留言:0更新日期:2023-01-14 18:01
一种声纹识别方法及装置、计算机可读存储介质、终端,所述声纹识别方法包括:获取测试对象的待识别声纹特征向量以及声纹库中的N个注册对象的注册声纹特征向量;对待识别声纹特征向量及N个注册声纹特征向量分别进行特征分离,得到测试对象的身份特征向量及非身份特征向量,N个注册对象的身份特征向量及非身份特征向量;计算测试对象的身份特征向量与N个注册对象的身份特征向量的相似度,得到N个原始相似度;根据测试对象的非身份特征向量与注册对象的非身份特征向量的相似度,计算补偿系数;采用补偿系数对原始相似度进行补偿,得到补偿后的相似度;基于补偿后的相似度得到测试对象的声纹识别结果。上述方案能够提高声纹识别的准确度。别的准确度。别的准确度。

【技术实现步骤摘要】
声纹识别方法及装置、计算机可读存储介质、终端


[0001]本专利技术实施例涉及声纹识别
,尤其涉及一种声纹识别方法及装置、计算机可读存储介质、终端。

技术介绍

[0002]声纹识别是一种从说话人语音中提取说话人身份特征并进行身份识别的技术,已经在金融证券、自动驾驶、智能家居等多个应用领域落地应用,给人们的生产生活带来了更多便利和安全保障。在声纹识别中,通常采用机器学习和基于深度学习的特征提取方法提取得到声纹特征,将提取到的声纹特征与声纹库中的注册对象的声纹特征进行相似度比较,根据比较结果与设定的判决阈值的关系,得到声纹识别结果。
[0003]然而,由于受实际场景中的环境差异等影响,导致声纹识别结果的准确度较低。

技术实现思路

[0004]本专利技术实施例解决的技术问题是如何提高声纹识别的准确度。
[0005]为解决上述技术问题,本专利技术实施例提供一种声纹识别方法,包括:获取测试对象的待识别声纹特征向量以及声纹库中的N个注册对象的注册声纹特征向量,N为正整数;对所述待识别声纹特征向量及N个注册声纹特征向量分本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种声纹识别方法,其特征在于,包括:获取测试对象的待识别声纹特征向量以及声纹库中的N个注册对象的注册声纹特征向量,N为正整数;对所述待识别声纹特征向量及N个注册声纹特征向量分别进行特征分离,得到所述测试对象的身份特征向量及非身份特征向量,N个注册对象的身份特征向量及非身份特征向量;计算所述测试对象的身份特征向量与N个注册对象的身份特征向量的相似度,得到N个原始相似度;根据所述测试对象的非身份特征向量与所述注册对象的非身份特征向量的相似度,计算补偿系数;采用所述补偿系数对所述原始相似度进行补偿,得到补偿后的相似度;基于所述补偿后的相似度得到所述测试对象的声纹识别结果。2.如权利要求1所述的声纹识别方法,其特征在于,所述根据所述测试对象的非身份特征向量与所述注册对象的非身份特征向量的相似度,计算补偿系数,包括:从N个原始相似度中选择满足补偿条件的原始相似度;针对各个满足补偿条件的原始相似度,根据满足补偿条件的原始相似度对应的注册对象的非身份特征向量与所述测试对象的非身份特征向量的相似度,计算各个满足补偿条件的原始相似度对应的补偿系数;其中,所述补偿条件包括以下任一条件:所述原始相似度处于预设的置信区间;大于等于置信度阈值的原始相似度的数目为多个,且多个原始相似度的差值处于预设的差值范围。3.如权利要求1所述的声纹识别方法,其特征在于,采用如下任一种相似度计算算法计算补偿系数:余弦相似度计算算法;基于欧式距离的相似度计算算法;基于神经网络模型的相似度计算算法。4.如权利要求1所述的声纹识别方法,其特征在于,所述采用所述补偿系数对所述原始相似度进行补偿,得到补偿后的相似度,包括:计算置信区间的上限值相对置信度阈值的上浮动量,以及所述置信区间的下限值分别相对置信度阈值的下浮动量;根据所述补偿系数、所述上浮动量及所述下浮动量,计算得到补偿量;采用所述补偿量对所述原始相似度进行补偿,得到补偿后的相似度。5.如权利要求4所述的声纹识别方法,其特征在于,采用如下公式计算补偿后的相似度:score
final
=score
original
+Δscore;Δscore=μ*(lower+uppe...

【专利技术属性】
技术研发人员:陆成叶顺舟邵子奇
申请(专利权)人:锐迪科微电子科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1