声纹验证方法、装置、电子设备和存储介质制造方法及图纸

技术编号:37995860 阅读:7 留言:0更新日期:2023-06-30 10:10
本公开涉及一种声纹验证方法、装置、电子设备和存储介质,涉及声纹识别技术领域,该方法包括:从待验证音频中提取噪声音频,对噪声音频和预先注册的注册音频进行音频混合,得到混合音频,根据混合音频和待验证音频,确定待验证音频的验证结果。本公开可以有效利用待验证音频,从待验证音频中提取噪声音频,并与注册音频进行音频混合,得到混合音频,混合音频对应的噪声与待验证音频所处音频输入环境中的噪声相匹配,这样使得利用混合音频和待验证音频确定的验证结果,能够有效应对待验证音频所处音频输入环境中出现的各种噪声,从而提高声纹验证的通过率,并确保验证结果的准确性。并确保验证结果的准确性。并确保验证结果的准确性。

【技术实现步骤摘要】
声纹验证方法、装置、电子设备和存储介质


[0001]本公开涉及声纹识别
,尤其涉及一种声纹验证方法、装置、电 子设备和存储介质。

技术介绍

[0002]随着语音技术的不断发展,声纹识别作为一种重要的生物认证技术,被 广泛应用于各种终端设备中。目前,在声纹识别的过程中,会预先引导用户 在相对安静的环境中进行一次声纹注册,来生成高质量的声纹模板库,再在 声纹验证时将用户的验证语音和声纹模板库进行对比,以判断声纹验证是否 通过。
[0003]然而,采用这样的方式,声纹注册的环境噪声无法和实际声纹验证时的 情况相匹配,尤其是在用户所处环境噪声发生较大改变时,会使得验证语音 和声纹模板库的匹配度急剧下降,这会影响声纹验证的通过率,同时会降低 验证结果的准确性。

技术实现思路

[0004]为克服相关技术中存在的问题,本公开提供一种声纹验证方法、装置、 电子设备和存储介质。
[0005]根据本公开实施例的第一方面,提供一种声纹验证方法,所述方法包括:
[0006]从待验证音频中提取噪声音频;
[0007]对所述噪声音频和预先注册的注册音频进行音频混合,得到混合音频;
[0008]根据所述混合音频和所述待验证音频,确定所述待验证音频的验证结果。
[0009]可选地,所述从待验证音频中提取噪声音频,包括:
[0010]利用预设噪声检测算法,从所述待验证音频中提取包含噪声的音频片段 作为所述噪声音频。
[0011]可选地,所述注册音频为多个,每个所述注册音频对应一个注册声纹特 征向量;所述对所述噪声音频和预先注册的注册音频进行音频混合,得到混 合音频,包括:
[0012]获取所述待验证音频对应的验证声纹特征向量;
[0013]根据所述验证声纹特征向量和所述注册声纹特征向量,从多个所述注册 音频中确定目标注册音频;
[0014]根据所述噪声音频对所述目标样本音频进行加噪,以对所述噪声音频和 所述目标样本音频进行音频混合,得到所述混合音频。
[0015]可选地,所述根据所述验证声纹特征向量和所述注册声纹特征向量,从 多个所述注册音频中确定目标注册音频,包括:
[0016]将每个所述注册音频对应的注册声纹特征向量和所述验证声纹特征向 量,输入到预先训练好的声纹匹配模型中,得到每个所述注册声纹特征向量 与所述验证声纹特征向量的匹配度;
[0017]将与所述验证声纹特征向量的匹配度最高的注册声纹特征向量对应的 注册音
频,作为所述目标注册音频。
[0018]可选地,所述根据所述混合音频和所述待验证音频,确定所述待验证音 频的验证结果,包括:
[0019]获取所述混合音频对应的目标声纹特征向量;
[0020]根据所述验证声纹特征向量和所述目标声纹特征向量,确定所述待验证 音频的验证结果。
[0021]可选地,所述根据所述验证声纹特征向量和所述目标声纹特征向量,确 定所述待验证音频的验证结果,包括:
[0022]将所述验证声纹特征向量和所述目标声纹特征向量,输入到预先训练好 的声纹验证模型中,得到所述验证声纹特征向量对应的验证置信度;
[0023]在所述验证置信度大于或等于预设阈值的情况下,确定所述待验证音频 通过声纹验证。
[0024]根据本公开实施例的第二方面,提供一种声纹验证装置,所述装置包括:
[0025]提取模块,被配置为从待验证音频中提取噪声音频;
[0026]混合模块,被配置为对所述噪声音频和预先注册的注册音频进行音频混 合,得到混合音频;
[0027]确定模块,被配置为根据所述混合音频和所述待验证音频,确定所述待 验证音频的验证结果。
[0028]可选地,所述提取模块被配置为利用预设噪声检测算法,从所述待验证 音频中提取包含噪声的音频片段作为所述噪声音频。
[0029]可选地,所述注册音频为多个,每个所述注册音频对应一个注册声纹特 征向量;所述混合模块包括:
[0030]第一获取子模块,被配置为获取所述待验证音频对应的验证声纹特征向 量;
[0031]第一确定子模块,被配置为根据所述验证声纹特征向量和所述注册声纹 特征向量,从多个所述注册音频中确定目标注册音频;
[0032]混合子模块,被配置为根据所述噪声音频对所述目标样本音频进行加噪, 以对所述噪声音频和所述目标样本音频进行音频混合,得到所述混合音频。
[0033]可选地,所述第一确定子模块被配置为:
[0034]将每个所述注册音频对应的注册声纹特征向量和所述验证声纹特征向 量,输入到预先训练好的声纹匹配模型中,得到每个所述注册声纹特征向量 与所述验证声纹特征向量的匹配度;
[0035]将与所述验证声纹特征向量的匹配度最高的注册声纹特征向量对应的 注册音频,作为所述目标注册音频。
[0036]可选地,所述确定模块包括:
[0037]第二获取子模块,被配置为获取所述混合音频对应的目标声纹特征向量;
[0038]第二确定子模块,被配置为根据所述验证声纹特征向量和所述目标声纹 特征向量,确定所述待验证音频的验证结果。
[0039]可选地,所述第二确定子模块被配置为:
[0040]将所述验证声纹特征向量和所述目标声纹特征向量,输入到预先训练好 的声纹
验证模型中,得到所述验证声纹特征向量对应的验证置信度;
[0041]在所述验证置信度大于或等于预设阈值的情况下,确定所述待验证音频 通过声纹验证。
[0042]根据本公开实施例的第三方面,提供一种电子设备,包括:
[0043]处理器;
[0044]用于存储处理器可执行指令的存储器;
[0045]其中,所述处理器被配置为执行本公开第一方面所提供的声纹验证方法 的步骤。
[0046]根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存 储有计算机程序指令,该程序指令被处理器执行时实现本公开第一方面所提 供的声纹验证方法的步骤。
[0047]本公开的实施例提供的技术方案可以包括以下有益效果:
[0048]本公开首先从待验证音频中提取噪声音频,之后对噪声音频和预先注册 的注册音频进行音频混合,得到混合音频,最后根据混合音频和待验证音频, 确定待验证音频的验证结果。本公开可以有效利用待验证音频,从待验证音 频中提取噪声音频,并与注册音频进行音频混合,得到混合音频,混合音频 对应的噪声与待验证音频所处音频输入环境中的噪声相匹配,这样使得利用 混合音频和待验证音频确定的验证结果,能够有效应对待验证音频所处音频 输入环境中出现的各种噪声,从而提高了声纹验证的通过率,并确保验证结 果的准确性。
[0049]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性 的,并不能限制本公开。
附图说明
[0050]此处的附图被并入说明书中并构成本说明书的一部分,示出了本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种声纹验证方法,其特征在于,所述方法包括:从待验证音频中提取噪声音频;对所述噪声音频和预先注册的注册音频进行音频混合,得到混合音频;根据所述混合音频和所述待验证音频,确定所述待验证音频的验证结果。2.根据权利要求1所述的方法,其特征在于,所述从待验证音频中提取噪声音频,包括:利用预设噪声检测算法,从所述待验证音频中提取包含噪声的音频片段作为所述噪声音频。3.根据权利要求1所述的方法,其特征在于,所述注册音频为多个,每个所述注册音频对应一个注册声纹特征向量;所述对所述噪声音频和预先注册的注册音频进行音频混合,得到混合音频,包括:获取所述待验证音频对应的验证声纹特征向量;根据所述验证声纹特征向量和所述注册声纹特征向量,从多个所述注册音频中确定目标注册音频;根据所述噪声音频对所述目标样本音频进行加噪,以对所述噪声音频和所述目标样本音频进行音频混合,得到所述混合音频。4.根据权利要求3所述的方法,其特征在于,所述根据所述验证声纹特征向量和所述注册声纹特征向量,从多个所述注册音频中确定目标注册音频,包括:将每个所述注册音频对应的注册声纹特征向量和所述验证声纹特征向量,输入到预先训练好的声纹匹配模型中,得到每个所述注册声纹特征向量与所述验证声纹特征向量的匹配度;将与所述验证声纹特征向量的匹配度最高的注册声纹特征向量对应的注册音频,作为所述目标注册音频。5.根据权利要求1所述的方法,其特征在于,所述根据所述混合音频和所述待验证音频,确定所述待验证音频的验证结果,包括:获取所述混合音频对应的目标声纹特征向量;根据所述验证声纹特征向量和所述目标声纹特征向量,确定所述待验证音频...

【专利技术属性】
技术研发人员:刘佳杨
申请(专利权)人:北京小米移动软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1