一种声纹资质考核方法、装置、设备及存储介质制造方法及图纸

技术编号:35520400 阅读:13 留言:0更新日期:2022-11-09 14:39
本发明专利技术提供了一种声纹资质考核方法、装置、设备及存储介质,其中,声纹资质考核方法包括:从若干等级分别对应的样本集中,获取考核等级对应的样本集,若干等级分别对应的样本集基于若干样本构建,一等级对应的样本集中包括若干样本中属于该等级的样本,属于不同等级的样本的判别难度不同,若干样本中的每个样本包括检材数据和样本数据,考核等级为若干等级中的一个等级;采用考核等级对应的样本集中的样本,测试待考核的声纹比对引擎的资质是否达到考核等级。本发明专利技术提供的声纹资质考核方法的考核流程较为简单,考核过程较为规范,可操作性强,考核结果的可信度较高,并且,不同声纹比对引擎的考核结果能够直接进行比较。引擎的考核结果能够直接进行比较。引擎的考核结果能够直接进行比较。

【技术实现步骤摘要】
一种声纹资质考核方法、装置、设备及存储介质


[0001]本专利技术涉及声纹资质考核
,尤其涉及一种声纹资质考核方法、装置、设备及存储介质。

技术介绍

[0002]通常,指纹、虹膜、DNA和笔迹等都可以作为识别个体身份的有效凭据,相对于基于这些传统的个体生物特征进行个体身份识别而言,基于声纹特征进行个体身份识别是一个新兴的研究领域。近年来,随着相关技术的深入研究和发展,基于声纹特征的个体身份识别技术越来越受到相关研究人员的重视。随着声纹识别领域的数据积累和研究发展,基于声纹特征进行个体身份识别的准确性越来越高。
[0003]基于声纹特征的个体身份识别技术指的是,通过声纹特征对比给出两个声纹特征是否同源(即两个声纹特征是否为同一个体的声纹特征)的判断。比如,对从案发现场获得的语音样本(即检材数据)提取声纹特征,通过将该声纹特征与从嫌疑人的语音样本(即样本数据)提取的声纹特征进行对比,来确定两个声纹特征是否同源,若两个声纹特征同源,说明从案发现场获得的语音样本为嫌疑人的语音样本。
[0004]目前,在国内绝大多数的法庭说话人识别案件中,都希望语音鉴定专家给出“是同一人”或“不是同一人”这样明确的结论。但是,由于受各种主客观条件的限制,如录音的环境及条件,语音证据提取、保存条件与方法,检验鉴定的时间间隔以及检验设备、检验方法的局限等等,罪犯样本和嫌疑人样本之间或多或少都会存在一定程度的差异,这就决定了鉴定人认定同一或否定排除要达到100%的确认几乎是不可能的。这种客观实际催生了众多声纹比对引擎被研发出来
[0005]现如今,市面上有众多的声纹比对引擎,但是,这些声纹比对引擎的比对质量良莠不齐,为了能够获知这些声纹比对引擎的比对质量,目前亟需一种能够对声纹比对引擎进行资质鉴定的方法。

技术实现思路

[0006]有鉴于此,本专利技术提供了一种声纹资质考核方法、装置、设备及存储介质,用以对声纹比对引擎进行资质鉴定,其技术方案如下:
[0007]一种声纹资质考核方法,包括:
[0008]从若干等级分别对应的样本集中,获取考核等级对应的样本集;其中,所述若干等级分别对应的样本集基于若干样本构建,一等级对应的样本集中包括所述若干样本中属于该等级的样本,属于不同等级的样本的判别难度不同,所述若干样本中的每个样本包括检材数据和样本数据,所述考核等级为所述若干等级中的一个等级;
[0009]采用所述考核等级对应的样本集中的样本,测试待考核的声纹比对引擎的资质是否达到所述考核等级。
[0010]可选的,所述若干等级分别对应的样本集的构建过程包括:
[0011]获取若干样本;
[0012]确定所述若干样本分别对应的判别难度表征值,其中,所述判别难度表征值能够表征对应样本的判别难度;
[0013]根据所述若干样本分别对应的判别难度表征值,从所述若干等级中确定所述若干样本分别所属的等级;
[0014]将属于同一等级的样本组成样本集,得到所述若干等级分别对应的样本集。
[0015]可选的,所述确定所述若干样本分别对应的判别难度表征值,包括:
[0016]针对所述若干样本中待确定判别难度表征值的目标样本:
[0017]基于标准的声纹提取模型,对所述目标样本包括的检材数据和样本数据分别提取声纹特征,得到所述目标样本对应的声纹特征对;
[0018]计算所述目标样本对应的声纹特征对的相似度,得到所述目标样本对应的声纹特征相似度;
[0019]根据所述目标样本对应的声纹特征相似度,确定所述目标样本对应的判别难度表征值。
[0020]可选的,所述根据所述目标样本对应的声纹特征相似度,确定所述目标样本对应的判别难度表征值,包括:
[0021]基于预设的线性映射关系,将所述目标样本对应的声纹特征相似度映射为能够表征所述目标样本的判别难度的值,作为所述目标样本对应的判别难度表征值。
[0022]可选的,所述若干个样本包括正样本和负样本,所述正样本包括的检材数据和样本数据来自同一对象,所述负样本包括的检材数据和样本数据来自不同对象;
[0023]所述基于预设的线性映射关系,将所述目标样本对应的声纹特征相似度映射为能够表征所述目标样本的判别难度的值,包括:
[0024]若所述目标样本为正样本,则基于针对正样本预设的第一线性映射关系,将所述目标样本的声纹特征相似度映射为能够表征所述目标样本的判别难度的值;
[0025]若所述目标样本为负样本,则基于针对负样本预设的第二线性映射关系,将所述目标样本的声纹特征相似度映射为能够表征所述目标样本的判别难度的值。
[0026]可选的,所述若干等级分别对应有判别难度表征值范围;
[0027]所述根据所述若干样本分别对应的判别难度表征值,从所述若干等级中确定所述若干样本分别所属的等级,包括:
[0028]针对所述若干个样本中待确定等级的目标样本:
[0029]从所述若干等级分别对应的判别难度表征值范围中,确定所述目标样本对应的判别难度表征值所在的判别难度表征值范围,作为目标判别难度表征值范围;
[0030]将所述目标判别难度表征值范围对应的等级,确定为所述目标样本所属的等级。
[0031]可选的,所述采用所述考核等级对应的样本集中的样本,测试待考核的声纹比对引擎的资质是否达到所述考核等级,包括:
[0032]从所述考核等级对应的样本集中获取指定数量的样本作为测试样本,以得到指定数量的测试样本;
[0033]基于所述声纹比对引擎判别每个测试样本包含的检材数据与样本数据是否来自同一对象,得到所述指定数量的测试样本分别对应的判别结果;
[0034]根据所述指定数量的测试样本分别对应的判别结果以及所述指定数量的测试样本分别对应的样本标签,确定所述声纹比对引擎的判别准确率,其中,所述样本标签用于指示对应的测试样本包含的检材数据和样本数据是否来自同一对象;
[0035]根据所述声纹比对引擎的判别准确率,确定所述声纹比对引擎的资质是否达到所述考核等级。
[0036]一种声纹资质考核装置,包括:样本集获取模块和声纹资质考核模块;
[0037]所述样本集获取模块,用于从若干等级分别对应的样本集中,获取考核等级对应的样本集;其中,所述若干等级分别对应的样本集基于若干样本构建,一等级对应的样本集中包括所述若干样本中属于该等级的样本,属于不同等级的样本的判别难度不同,所述若干样本中的每个样本包括检材数据和样本数据,所述考核等级为所述若干等级中的一个等级;
[0038]所述声纹资质考核模块,用于采用所述考核等级对应的样本集中的样本,测试待考核的声纹比对引擎的资质是否达到所述考核等级。
[0039]一种声纹资质考核设备,包括:存储器和处理器;
[0040]所述存储器,用于存储程序;
[0041]所述处理器,用于执行所述程序,实现上述任一项所述的声纹资质考核方法的各个步骤。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种声纹资质考核方法,其特征在于,包括:从若干等级分别对应的样本集中,获取考核等级对应的样本集;其中,所述若干等级分别对应的样本集基于若干样本构建,一等级对应的样本集中包括所述若干样本中属于该等级的样本,属于不同等级的样本的判别难度不同,所述若干样本中的每个样本包括检材数据和样本数据,所述考核等级为所述若干等级中的一个等级;采用所述考核等级对应的样本集中的样本,测试待考核的声纹比对引擎的资质是否达到所述考核等级。2.根据权利要求1所述的声纹资质考核方法,其特征在于,所述若干等级分别对应的样本集的构建过程包括:获取若干样本;确定所述若干样本分别对应的判别难度表征值,其中,所述判别难度表征值能够表征对应样本的判别难度;根据所述若干样本分别对应的判别难度表征值,从所述若干等级中确定所述若干样本分别所属的等级;将属于同一等级的样本组成样本集,得到所述若干等级分别对应的样本集。3.根据权利要求2所述的声纹资质考核方法,其特征在于,所述确定所述若干样本分别对应的判别难度表征值,包括:针对所述若干样本中待确定判别难度表征值的目标样本:基于标准的声纹提取模型,对所述目标样本包括的检材数据和样本数据分别提取声纹特征,得到所述目标样本对应的声纹特征对;计算所述目标样本对应的声纹特征对的相似度,得到所述目标样本对应的声纹特征相似度;根据所述目标样本对应的声纹特征相似度,确定所述目标样本对应的判别难度表征值。4.根据权利要求3所述的声纹资质考核方法,其特征在于,所述根据所述目标样本对应的声纹特征相似度,确定所述目标样本对应的判别难度表征值,包括:基于预设的线性映射关系,将所述目标样本对应的声纹特征相似度映射为能够表征所述目标样本的判别难度的值,作为所述目标样本对应的判别难度表征值。5.根据权利要求4所述的声纹资质考核方法,其特征在于,所述若干个样本包括正样本和负样本,所述正样本包括的检材数据和样本数据来自同一对象,所述负样本包括的检材数据和样本数据来自不同对象;所述基于预设的线性映射关系,将所述目标样本对应的声纹特征相似度映射为能够表征所述目标样本的判别难度的值,包括:若所述目标样本为正样本,则基于针对正样本预设的第一线性映射关系,将所述目标样本的声纹特征相似度映射为能够表征所述目标样本的判别难度的值;若所述目标样本为负样本,则基于针对负样本预设的第二线性映射关系,将所述目标样本的声纹特征相似度映射...

【专利技术属性】
技术研发人员:梁萌付中华
申请(专利权)人:西安讯飞超脑信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1