声纹识别方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:31715781 阅读:43 留言:0更新日期:2022-01-01 11:20
本公开提供一种声纹识别方法、装置、电子设备及可读存储介质。声纹识别方法包括:生成与待识别音频对应的第一声纹向量;检索目标数据库,得到所述目标数据库中与所述第一声纹向量匹配的N个声纹向量,N为大于1的整数;计算所述N个声纹向量中每个声纹向量与所述第一声纹向量的相似度,得到N个相似度值;将第二声纹向量对应的用户确定为所述第一声纹向量对应的用户,所述第二声纹向量为所述N个相似度值中最高相似度值对应的声纹向量。本公开可以提高声纹识别准确率。声纹识别准确率。声纹识别准确率。

【技术实现步骤摘要】
声纹识别方法、装置、电子设备及可读存储介质


[0001]本公开实施例涉及通信
,尤其涉及一种声纹识别方法、装置、电子设备及可读存储介质。

技术介绍

[0002]与传统的身份识别技术相比,声纹识别的优势在于,声纹提取过程简单,成本低,且具有唯一性,不易伪造和假冒。因此,声纹识别可以应用在刑侦、银行、证券、保险等领域用于身份识别。
[0003]现有的声纹识别通过将待识别的音频与预先存储的多个音频进行梅尔频率倒谱系数(Mel

Frequency Cepstral Coefficients,MFCC)、线性预测倒谱系数(Linear Prediction Cepstrum Coefficients,LPCC)等特征比对,以得到声纹识别结果。然而,上述特征容易受身体状况、年龄、情绪等影响,也容易受环境影响,因此,采用上述方式进行声纹识别的准确率较低。

技术实现思路

[0004]本公开实施例提供一种声纹识别方法、装置、电子设备及可读存储介质,以解决现有声纹识别的准确率较低的问题。
[0005]为解决上述问题,本公开是这样实现的:
[0006]第一方面,本公开实施例提供了一种声纹识别方法,包括:
[0007]生成与待识别音频对应的第一声纹向量;
[0008]检索目标数据库,得到所述目标数据库中与所述第一声纹向量匹配的N个声纹向量,N为大于1的整数;
[0009]计算所述N个声纹向量中每个声纹向量与所述第一声纹向量的相似度,得到N个相似度值;<br/>[0010]将第二声纹向量对应的用户确定为所述第一声纹向量对应的用户,所述第二声纹向量为所述N个相似度值中最高相似度值对应的声纹向量。
[0011]第二方面,本公开实施例还提供一种声纹识别装置,包括:
[0012]生成模块,用于生成与待识别音频对应的第一声纹向量;
[0013]检索模块,用于检索目标数据库,得到所述目标数据库中与所述第一声纹向量匹配的N个声纹向量,N为大于1的整数;
[0014]计算模块,用于计算所述N个声纹向量中每个声纹向量与所述第一声纹向量的相似度,得到N个相似度值;
[0015]确定模块,用于将第二声纹向量对应的用户确定为所述第一声纹向量对应的用户,所述第二声纹向量为所述N个相似度值中最高相似度值对应的声纹向量。
[0016]第三方面,本公开实施例还提供一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理
器执行时实现如上所述的声纹识别方法的步骤。
[0017]第四方面,本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的应用于电子设备的声纹识别方法的步骤。
[0018]在本公开实施例中,电子设备可以先确定与待识别音频对应的声纹向量,将待识别音频对应的第一声纹向量导入目标数据库,检索得到与所述第一声纹向量匹配的N个声纹向量,之后,计算所述N个声纹向量中每个声纹向量与所述第一声纹向量的相似度,得到N个相似度值,将最高相似度值对应的声纹向量关联的用户确定为所述待识别音频关联的用户。通过利用待识别音频的声纹向量进行声纹识别,可以提高声纹识别的准确率。
[0019]应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
[0020]图1是根据一示例性实施例示出的声纹识别方法的流程图;
[0021]图2是根据一示例性实施例示出的声纹识别装置的结构图;
[0022]图3是根据一示例性实施例示出的电子设备的结构图。
[0023]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
具体实施方式
[0024]下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
[0025]本公开中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0026]以下对本公开实施例的声纹识别方法进行说明。
[0027]参见图1,图1是根据一示例性实施例示出的声纹识别方法的流程图。本公开实施例的声纹识别方法应用于电子设备。在实际应用中,电子设备可以是手机、电脑、电视、可穿戴式设备或车载设备等。
[0028]如图1所示,声纹识别方法可以包括以下步骤:
[0029]在步骤101中,生成与待识别音频对应的第一声纹向量。
[0030]具体实现时,电子设备可以通过深度学习模型生成所述第一声纹向量。在实施时,可以将所述待识别音频输入深度学习模型,以使深度学习模型输出所述第一声纹向量。
[0031]在步骤102中,检索目标数据库,得到所述目标数据库中与所述第一声纹向量匹配的N个声纹向量,N为大于1的整数。
[0032]目标数据库可以存储有R个声纹向量,以及所述R个声纹向量一一对应的R个标识信息,所述标识信息可以用于标识唯一的用户,R为大于或等于N的整数。在某些实施方式中,可选地,所述目标数据库可以为脸书开源的人工智能相似性搜索(Facebook AI Similarity Search,Faiss)数据库,Faiss是Facebook开源的一个向量检索引擎,Faiss数据库的检索原理可参考相关技术中的说明,此处不作描述。Faiss可以解决暴力检索向量耗时巨大的问题,这样,通过利用Faiss数据库进行声纹向量的检索,可以提高声纹识别效率。当然,在另一些实施方式中,所述目标数据库可以为任意类型的数据库,如:elasticsearch数据库,即可以采用elasticsearch(一个搜索引擎框架)的向量检索功能进行声纹向量的检索,elasticsearch数据库可以将需要检索的字段存储为需要检索的向量。
[0033]具体实现时,电子设备可以将所述第一声纹向量导入所述目标数据库中,通过所述目标数据库检索得到与所述第一声纹向量匹配的N个声纹向量。可以理解地是,通过所述目标数据库检索得到的所述N个声纹向量为所述目标数据库中与所述第一声纹向量最接近的N个声纹向量。
[0034]需要说明的是,N可以预先设定,或者,N可以为通过所述目标数据库检索得到的与所述第一声纹向量匹配的声纹向量的实际数量,具体可根据实际情况决定,本公开实施例对此不做限定。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种声纹识别方法,其特征在于,包括:生成与待识别音频对应的第一声纹向量;检索目标数据库,得到所述目标数据库中与所述第一声纹向量匹配的N个声纹向量,N为大于1的整数;计算所述N个声纹向量中每个声纹向量与所述第一声纹向量的相似度,得到N个相似度值;将第二声纹向量对应的用户确定为所述第一声纹向量对应的用户,所述第二声纹向量为所述N个相似度值中最高相似度值对应的声纹向量。2.根据权利要求1所述的方法,其特征在于,所述目标数据库为P个,所述P个目标数据库与P个区域一一对应,P为大于1的整数;所述检索目标数据库,得到所述目标数据库中与所述第一声纹向量匹配的N个声纹向量,包括:获取与所述待识别音频对应的Q个区域,Q为小于或等于P的正整数;检索Q个目标数据库中的至少一个目标数据库,得到与所述第一声纹向量匹配的N个声纹向量,所述Q个目标数据库与所述Q个区域一一对应。3.根据权利要求2所述的方法,其特征在于,所述检索与所述Q个区域一一对应的Q个目标数据库中的至少一个目标数据库,包括:获取所述Q个区域的检索优先级;按照所述Q个区域的检索优先级从高到低的顺序检索所述Q个目标数据库,直至满足以下任一项:完成所述Q个目标数据库的检索;与所述第一声纹向量匹配的声纹向量的数量达到N。4.根据权利要求1所述的方法,其特征在于,所述目标数据库为K个,所述K个目标数据库与K个预设等级一一对应,K为大于1的整数;所述检索目标数据库,得到所述目标数据库中与所述第一声纹向量匹配的N个声纹向量,包括:按照所述K个预设等级从高到低的顺序检索所述K个目标数据库,直至满足以下任一项:完成所述K个目标数据库的检索;确定的与所述第一声纹向量匹配的声纹向量的数量达到N。5.根据权利要求1所述的方法,其特征在于,所述检索目标数据库,得到所述目标数据库中与所述第一声纹向量匹配的N个声纹向量,包括:确定所述待识别音频是否满足第一条件;在所述待识别音频满足所述第一条件的情况下,获取...

【专利技术属性】
技术研发人员:哈玉杰李智勇陈孝良
申请(专利权)人:北京声智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1