一种声纹验证方法及装置制造方法及图纸

技术编号:34994368 阅读:22 留言:0更新日期:2022-09-21 14:41
本发明专利技术公开了一种声纹验证方法,涉及声纹识别与语音欺骗检技术领域,包括S100、注册声纹信息,建立用户声纹数据库;S200、进行声纹验证。本发明专利技术还公开了一种声纹验证装置,包括数据获取单元、欺骗检测单元、声纹建模单元和验证单元。本系统在进行声纹验证之前,先进行欺骗检测,对真实的用户声纹特征正常接受,对合成的、假冒的非法声纹特征予以拒绝,提高了声纹验证系统的安全性,有效避免了语音合成与语音转换攻击对声纹验证系统安全性的威胁。音转换攻击对声纹验证系统安全性的威胁。音转换攻击对声纹验证系统安全性的威胁。

【技术实现步骤摘要】
一种声纹验证方法及装置


[0001]本专利技术涉及声纹识别与语音欺骗检测
,尤其涉及一种声纹验证方法及装置。

技术介绍

[0002]声纹识别是根据待识别语音的声纹特征识别该段语音所对应的说话人的过程。声纹识别技术作为生物特征识别技术的应用之一,具有识别准确率较高、应用难度低、用户接受度高、采集成本低等特点,因此,基于声纹识别的身份认证技术具有非常广阔的应用前景。声纹识别系统按其所要识别的任务可分为两类应用场景:声纹验证与声纹辨认。其中,声纹验证用于判断未知说话人是否为某个指定说话人。
[0003]专利CN112802481A提出了一种声纹验证方法,将待验证语音输入声纹特征表示模型得到声纹特征向量,将所得声纹特征向量与已注册语音对应的声纹特征向量进行对比,得到验证结果。这种方法能够顺利达到声纹验证的效果,但是缺乏对于实际使用时可能存在的非法攻击的应对措施,验证系统的安全性无法得到保证。
[0004]当前的声纹验证系统面临着一些挑战。由于实际应用过程中存在特征参数提取不稳定、声纹采集的各种环境噪声等问题,现有的声纹验证系统仍难言可靠,识别精度与鲁棒性仍有待进一步提高。此外,声纹识别作为一种较为成熟的生物特征识别技术,与其他生物特征识别技术一样,随时存在入侵者通过模仿、合成、篡改特征等方法非法通过识别系统验证的风险。
[0005]因此,本领域的技术人员致力于开发一种声纹验证方法和装置。

技术实现思路

[0006]有鉴于现有技术的上述缺陷,本专利技术所要解决的技术问题是如何提高声纹验证系统的识别精度与安全性。
[0007]专利技术人分析了声纹验证系统的工作过程,一般可以分为注册和验证两个阶段,主要包含特征提取、声纹建模与匹配判断三个关键步骤。在系统进行声纹验证之前,先进行欺骗检测,对真实的用户声纹特征正常接受,对合成的、假冒的非法声纹特征予以拒绝,能够提高声纹验证系统的安全性。
[0008]本专利技术的一个实施例中,提供了一种声纹验证方法,包括:
[0009]S100、注册声纹信息,建立用户声纹数据库;
[0010]S200、进行声纹验证。
[0011]可选地,在上述实施例中的声纹验证方法中,步骤S100具体包括:
[0012]S110、输入注册用户信息;
[0013]S120、录入注册语音;
[0014]S130、将注册语音输入声纹识别模型,得到注册语音对应说话人嵌入;
[0015]S140、将注册用户信息与对应说话人嵌入录入用户声纹数据库。
[0016]可选地,在上述实施例中的声纹验证方法中,步骤S110中的注册用户信息标识用户身份,具有区分性和不可替代性,作为标签从声纹数据库中调取对应的声纹信息。
[0017]进一步地,在上述实施例中的声纹验证方法中,用户信息为用户的姓名、身份证号。
[0018]进一步地,在上述实施例中的声纹验证方法中,用户信息是某一项或多项,须保证所用用户录入的信息属性一致,即规定所有用户注册时都录入姓名信息,不允许一部分用户注册时使用姓名而一部分用户注册时使用身份证号。
[0019]可选地,在上述任一实施例中的声纹验证方法中,步骤S120中注册语音的获取方式为实时录制,注册语音的内容提示为程序随机设置,注册语音的长度长短适中,以便后续处理。
[0020]进一步地,在上述任一实施例中的声纹验证方法中,注册语音为多条文本,内容不同,内容涵盖中文语句、英文语句、数字、字母,保证注册语音充分代表用户声纹特征,确保声纹验证的准确性。
[0021]进一步地,在上述任一实施例中的声纹验证方法中,录入时保证语音内容的连续性。
[0022]可选地,在上述任一实施例中的声纹验证方法中,步骤S130中的声纹识别模型利用基于残差网络(Residual Network,ResNet)训练的神经网络编码器提取待验证语音的声纹特征,从输入的语音文件中提取出固定维度的嵌入表示,即说话人嵌入(speaker embedding)。
[0023]可选地,在上述任一实施例中的声纹验证方法中,步骤S140中将所有注册用户信息与注册语音的说话人嵌入归类整理,建立用户声纹数据库,用于声纹验证时查找所需验证的用户信息对应的说话人嵌入。
[0024]可选地,在上述任一实施例中的声纹验证方法中步骤S200具体包括:
[0025]S210、获取待验证语音与用户信息;
[0026]S220、将待验证语音输入欺骗检测模型,判断待验证语音的真伪;如果待验证语音为伪造,拒绝通过并显示警报;如果待验证语音为真实,则执行S230;
[0027]S230、将待验证语音输入声纹识别模型,得到说话人嵌入;
[0028]S240、将说话人嵌入与声纹库中该用户的说话人嵌入对比,计算相似度得分;
[0029]S250、将相似度得分与阈值对比,得到验证结果。
[0030]可选地,在上述任一实施例中的声纹验证方法中,步骤S210中用户信息代表用户身份,作为查询条件在用户声纹数据库中查询到对应的声纹数据的信息。
[0031]进一步地,在上述实施例中的声纹验证方法中,用户信息是用户的姓名。
[0032]可选地,在上述任一实施例中的声纹验证方法中,步骤S220中的欺骗检测模型基于残差网络训练的二元分类器,能够从待检测语音中提取声学特征,并输出二维分类向量,分别表示待检测语音为真或伪的概率。
[0033]可选地,在上述任一实施例中的声纹验证方法中,步骤S220还包括:
[0034]S221、将待验证语音输入欺骗检测模型,得到分类向量;
[0035]S222、根据分类向量中待验证语音为真或伪的概率计算对策得分,计算公式为:CM(s)=log(p(bonafide|s;θ))

log(p(spoof|s;θ)),其中s表示待检测音频文件,θ表示模型
参数,p(bonafide|s;θ)表示模型参数为θ的条件下音频s为真实音频的概率,p(spoof|s;θ)表示模型参数为θ的条件下音频s为伪造音频的概率;
[0036]S223、将对策得分与给定阈值对比,得到检测结果;
[0037]S224、如果检测结果为真,则继续进行后续验证;否则,拒绝通过,并显示警报。
[0038]可选地,在上述任一实施例中的声纹验证方法中,步骤S230中的声纹识别模型与步骤S100中的注册声纹信息时所使用的相同,声纹识别模型的输入为待验证语音的音频文件,输出为对应的说话人嵌入。
[0039]可选地,在上述任一实施例中的声纹验证方法中,步骤S240包括:
[0040]S241、利用待验证用户信息在用户声纹数据库中查找到待验证用户的注册语音的说话人嵌入;
[0041]S242、使用相似度计算公式分别计算待验证语音的说话人嵌入与注册语音的说话人嵌入的相似度;
[0042]S243、得到相似度得分。
[004本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种声纹验证方法,其特征在于,包括:S100、注册声纹信息,建立用户声纹数据库,具体包括:S110、输入注册用户信息;S120、录入注册语音;S130、将所述注册语音输入声纹识别模型,得到所述注册语音对应说话人嵌入;S140、将所述注册用户信息与所述对应说话人嵌入录入所述用户声纹数据库;S200、进行声纹验证,具体包括:S210、获取待验证语音与用户信息;S220、将待验证语音输入欺骗检测模型,判断所述待验证语音的真伪;如果所述待验证语音为伪造,拒绝通过并显示警报;如果所述待验证语音为真实,则执行S230;S230、将所述待验证语音输入所述声纹识别模型,得到说话人嵌入;S240、将所述说话人嵌入与声纹库中该用户的说话人嵌入对比,计算相似度得分;S250、将所述相似度得分与阈值对比,得到验证结果。2.如权利要求1所述的声纹验证方法,其特征在于,所述注册用户信息标识用户身份,具有区分性和不可替代性,作为标签从声纹数据库中调取对应的声纹信息。3.如权利要求1所述的声纹验证方法,其特征在于,所述注册语音的获取方式为实时录制,所述注册语音的内容提示为程序随机设置,所述注册语音的长度长短适中。4.如权利要求1所述的声纹验证方法,其特征在于,所述声纹识别模型利用基于残差网络训练的神经网络编码器提取所述待验证语音的声纹特征,从输入的语音文件中提取出固定维度的嵌入表示,即说话人嵌入。5.如权利要求1所述的声纹验证方法,其特征在于,将所有所述注册用户信息与所述注册语音的说话人嵌入归类整理,建立用户声纹数据库,用于声纹验证时查找所需验证的用户信息对应的说话人嵌入。6.如权利要求1所述的声纹验证方法,其特征在于,所述欺骗检测模型基于残差网络训练的二元分类器,能够从所述待检测语音中提取声学特征,并输出二维分类向量,分别表示所述待检测语音为真或伪的概率。7.如权利要求1所述的声纹验证方法,其特征在于,所述步骤S220还包括:S221、将所述待验证语音输入所述欺骗检测模型,得到分类向量;S222、根据所述分类向量中所述待验证语音为真或伪的概率计算对策得分;S223、将所述对策得分与给定阈值对比,得到检测结果;S224、如果所述检测结果为真,则继续进行后续验证;否则,拒绝通过,并显示警报。8.如权利要...

【专利技术属性】
技术研发人员:郎小凡李雅褚健杨根科
申请(专利权)人:上海交通大学宁波人工智能研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1