一种声纹识别方法、装置、终端及存储介质制造方法及图纸

技术编号:38663545 阅读:9 留言:0更新日期:2023-09-02 22:45
本发明专利技术公开了一种声纹识别方法、装置、终端及存储介质,包括:获取测试语音和训练语音,测试语音和训练语音均包括多个语音特征;将测试语音和训练语音分别输入到训练好的声纹模型中,获得测试语音中多个语音特征分别对应预设语音特征的第一后验概率矩阵,及训练语音中多个语音特征分别对应预设语音特征的第二后验概率矩阵;利用CDS相似度算法,对第一后验概率矩阵及第二后验概率矩阵进行相似度比较,得到所述测试语音的声纹识别结果。通过本发明专利技术通过分别计算测试语音和训练语音的后验概率矩阵,利用CDS相似度算法,对两个矩阵进行相似度比较,得到测试语音的声纹识别结果。通过本发明专利技术提供的方法提高了运算的速度及声纹识别的准确率。准确率。准确率。

【技术实现步骤摘要】
一种声纹识别方法、装置、终端及存储介质


[0001]本专利技术涉及人工智能
,具体涉及一种声纹识别方法、装置、终端及存储介质。

技术介绍

[0002]声纹信息中包含了说话人的身份信息,是一种通过语音波形反映说话人生理和行为特征的语音信息。但是没有包含说话人的生命信息,所以声纹识别模型可以抵御冒名攻击而无法有效防御攻击。声纹识别是指通过未知说话人或不确定说话人的语音声学特征与已知说话人的语音声学特征进行综合分析比对,做出两者是否同一的结论的过程,为了提升声纹识别的准确性和高效性,设计一种声纹识别分析方法是非常必要的。

技术实现思路

[0003]因此,本专利技术提供的一种声纹识别方法、装置、终端及存储介质,克服了现有技术中对于待识别语音识别准确率低、速度慢的缺陷。
[0004]为达到上述目的,本专利技术提供如下技术方案:
[0005]第一方面,本专利技术实施例提供一种声纹识别方法,包括:
[0006]获取测试语音和训练语音,所述测试语音和训练语音均包括多个语音特征;
[0007]将测试语音和训练语音分别输入到训练好的声纹模型中,获得测试语音中多个语音特征分别对应预设语音特征的第一后验概率矩阵,及训练语音中多个语音特征分别对应预设语音特征的第二后验概率矩阵;
[0008]利用CDS相似度算法,对第一后验概率矩阵及第二后验概率矩阵进行相似度比较,得到所述测试语音的声纹识别结果。
[0009]可选地,所述声纹模型包括包括:声纹背景子模型、声纹分类子模型及声纹识别子模型,其中,
[0010]声纹背景子模型,用于滤除输入语音的背景噪声;
[0011]声纹分类子模型,用于对输入语音进行分类,其中,每个语音样本均对应有一个类别标签;
[0012]声纹识别子模型,用于对输入语音进行声纹目标识别。
[0013]可选地,所述声纹模型中任意一个子模型的训练过程均包括:
[0014]获取预设语音集,所述预设语音集包括多个语音样本;
[0015]采用小波变换对预设语音集进行分解,提取多个语音样本特征对应的小波熵;
[0016]将所述小波熵输入预设神经网络训练声纹子模型中进行训练,当满足预设条件时,得到训练好的声纹子模型。
[0017]可选地,所述声纹分类子模型通过EM估计算法验证该子模型是否完成训练。
[0018]可选地,所述声纹识别子模型通过MAP算法验证该子模型是否完成训练。
[0019]可选地,所述预设神经网络为卷积神经网络,其结构包括:输入层、第一隐藏层、第
二隐藏层、第三隐藏层、第四隐藏层及输出层,后验概率矩阵为预设神经网络的输出。
[0020]可选地,所述语音特征包括:语音频率、语音分贝、语音的语义及语音字符的数量。
[0021]第二方面,本专利技术实施例提供一种声纹识别装置,包括:
[0022]获取模块,用于获取测试语音和训练语音,所述测试语音和训练语音均包括多个语音特征;
[0023]训练模块,用于将测试语音和训练语音分别输入到训练好的声纹模型中,获得测试语音中多个语音特征分别对应预设语音特征的第一后验概率矩阵,及训练语音中多个语音特征分别对应预设语音特征的第二后验概率矩阵;
[0024]识别模块,用于利用CDS相似度算法,对第一后验概率矩阵及第二后验概率矩阵进行相似度比较,得到所述测试语音的声纹识别结果。
[0025]第三方面,本专利技术实施例提供一种终端,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行本专利技术实施例第一方面所述的声纹识别方法。第四方面,本专利技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行本专利技术实施例第一方面所述的声纹识别方法。
[0026]本专利技术技术方案,具有如下优点:
[0027]本专利技术提供的一种声纹识别方法、装置、终端及存储介质,通过本专利技术提供的声纹模型,分别计算测试语音和训练语音的后验概率矩阵,利用CDS相似度算法,对两个矩阵进行相似度比较,得到测试语音的声纹识别结果,通过本专利技术提供的方法提高了运算的速度及声纹识别的准确率。
附图说明
[0028]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0029]图1为本专利技术实施例提供的一种声纹识别方法的一个具体示例的流程图;
[0030]图2为本专利技术实施例提供的卷积神经网络的一个具体示例的结构图;
[0031]图3为本专利技术实施例提供的一种声纹识别装置一个具体示例的模块组成图;
[0032]图4为本专利技术实施例提供的一种终端一个具体示例的组成图。
具体实施方式
[0033]下面将结合附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0034]在本专利技术的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、
以特定的方位构造和操作,因此不能理解为对本专利技术的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
[0035]在本专利技术的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,还可以是两个元件内部的连通,可以是无线连接,也可以是有线连接。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本专利技术中的具体含义。
[0036]此外,下面所描述的本专利技术不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
[0037]实施例1
[0038]本专利技术实施例提供的一种声纹识别方法,用于音响、手机等需要通过识别声纹信息进行工作的终端设备。
[0039]如图1所示,包括如下步骤:
[0040]步骤S1:获取测试语音和训练语音,测试语音和训练语音均包括多个语音特征。
[0041]在本专利技术实施例中,通过语音录制设备获取测试语音及训练语音,语音的录制设备在此不作限制,根据实际情况进行相应的选取。语本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种声纹识别方法,其特征在于,包括:获取测试语音和训练语音,所述测试语音和训练语音均包括多个语音特征;将测试语音和训练语音分别输入到训练好的声纹模型中,获得测试语音中多个语音特征分别对应预设语音特征的第一后验概率矩阵,及训练语音中多个语音特征分别对应预设语音特征的第二后验概率矩阵;利用CDS相似度算法,对第一后验概率矩阵及第二后验概率矩阵进行相似度比较,得到所述测试语音的声纹识别结果。2.根据权利要求1所述的声纹识别方法,其特征在于,所述声纹模型包括包括:声纹背景子模型、声纹分类子模型及声纹识别子模型,其中,声纹背景子模型,用于滤除输入语音的背景噪声;声纹分类子模型,用于对输入语音进行分类,其中,每个语音样本均对应有一个类别标签;声纹识别子模型,用于对输入语音进行声纹目标识别。3.根据权利要求2所述的声纹识别方法,其特征在于,所述声纹模型中任意一个子模型的训练过程均包括:获取预设语音集,所述预设语音集包括多个语音样本;采用小波变换对预设语音集进行分解,提取多个语音样本特征对应的小波熵;将所述小波熵输入预设神经网络训练声纹子模型中进行训练,当满足预设条件时,得到训练好的声纹子模型。4.根据权利要求3所述的声纹识别方法,其特征在于,所述声纹分类子模型通过EM估计算法验证该子模型是否完成训练。5.根据权利要求3所述的声纹识别方法,其特征在于,所述声纹识别子模型通过MAP算法验证该子模型是否完成训练。6....

【专利技术属性】
技术研发人员:王宇徐念龙潘俊谭泉石林
申请(专利权)人:王力安防科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1