身份识别方法、装置、介质及电子设备制造方法及图纸

技术编号:20366639 阅读:24 留言:0更新日期:2019-02-16 18:15
本发明专利技术实施例涉及数据处理技术领域,提供了一种身份识别方法、身份识别装置、计算机可读介质及电子设备,该身份识别方法包括:对待识别用户的音频片段进行预处理获得第一语音特征数据;基于神经网络模型,根据所述第一语音特征数据确定待识别声纹特征;将所述待识别声纹特征与预先设置的声纹特征库中的标记声纹特征进行比对,并根据比对结果对所述待识别用户进行身份识别。本发明专利技术实施例的技术方案基于经过大数据训练后的神经网络模型能够获得对待识别用户的深层表示特征,能够扩展声纹特征维度,有利于增加不同的标记声纹之间的差异度,进而有利于提高对待测试用户进行身份识别的准确性和稳定性。

【技术实现步骤摘要】
身份识别方法、装置、介质及电子设备
本专利技术涉及数据处理
,具体而言,涉及一种身份识别方法、身份识别装置、计算机可读介质及电子设备。
技术介绍
声纹(Voiceprint)是用电声学仪器显示的携带言语信息的声波频谱。每个人发出的声音是由人体语言中枢与发音器官之间一个复杂的生理物理过程,人在讲话时使用的器官——舌、牙齿、喉头、肺、从测试者的语音中提取短时语音频谱(即基因频率谱及其固有特征)特征作为测试者的声纹特征(记作“待测声纹特征”),并将提取到的待测声纹特征与已有的声纹模型库中的模板声纹特征进行匹配,鼻腔在尺寸和形态等方面,不同人的声纹之间存在差异性。同时,同一个人在十几岁发育变声之后,其声纹基本保持不变。因此,可以通过声纹进行身份识别被广泛应用。利用现有的基于声纹的身份识别方法进行身份识别的过程中,进而通过计算待测声纹特征和模板声纹特征的相似度的方式完成对+测试者的身份识别。其中,声纹模型库中的模板声纹特征也可以是利用短时语音频谱方法提取的。然而,现有的基于声纹的身份识别方法的准确度有待提高。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本专利技术的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本专利技术实施例的目的在于提供一种身份识别方法、身份识别装置、计算机可读介质及电子设备,进而至少在一定程度上克服现有的基于声纹的身份识别方法的准确度有待提高的缺点。本专利技术的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本专利技术的实践而习得。根据本专利技术实施例的第一方面,提供了一种身份识别方法,包括:对待识别用户的音频片段进行预处理获得第一语音特征数据;基于神经网络模型,根据所述第一语音特征数据确定待识别声纹特征;将所述待识别声纹特征与预先设置的声纹特征库中的标记声纹特征进行比对,并根据比对结果对所述待识别用户进行身份识别。在本专利技术的一些实施例中,基于前述方案,对待识别用户的音频片段进行预处理获得第一语音特征数据,包括:根据对待识别用户的音频片段的频率分析,对所述音频片段分帧处理获得M个音频帧;获取所述M个音频帧对应的梅尔频率倒谱系数MFCC特征,其中每个音频帧的MFCC特征包含N维;根据所述MFCC特征确定所述音频片段对应的第一语音特征数据,其中所述第一语音特征数据为M*N维,M、N为正整数。在本专利技术的一些实施例中,基于前述方案,在对待识别用户的音频片段进行预处理获得第一语音特征数据之前,还包括:通过音频采集设备采集所述待测试用户的原始音频片段;利用频域维纳滤波方法对所述原始音频片段的信道噪声进行去噪处理,得到去噪后的音频片段;获取符合预设条件的去噪后的音频片段。在本专利技术的一些实施例中,基于前述方案,基于神经网络模型,根据所述第一语音特征数据确定待识别声纹特征,包括:根据所述第一语音特征数据获取测试锚样例和测试正样例,根据不同于所述第一语音特征数据的第二语音特征数据获取测试负样例;训练神经网络模型,并将所述测试锚样例、所述测试正样例和所述测试负样例输入训练后的神经网络模型;根据所述训练后的神经网络模型的输出确定待识别声纹特征。在本专利技术的一些实施例中,基于前述方案,根据所述第一语音特征数据获取测试锚样例和测试正样例,根据不同于所述第一语音特征数据的第二语音特征数据获取测试负样例,包括:将所述第一语音特征数据输入第一神经网络模型进行特征融合得到测试锚样例;将所述第一语音特征数据输入第二神经网络模型进行特征融合得到测试正样例;以及,将所述第二语音特征数据输入第三神经网络模型进行特征融合得到测试负样例。在本专利技术的一些实施例中,基于前述方案,训练神经网络模型,包括:根据标记用户的音频片段进行预处理获得第三语音特征数据;根据所述第三语音特征数据获取训练锚样例和训练正样例,根据不同于所述第三语音特征数据的第四语音特征数据获取训练负样例,其中,所述训练锚样例、训练正样例和所述训练负样例形成训练数据集;基于误差函数Tripletloss训练所述训练数据集,以获得训练后的神经网络模型。在本专利技术的一些实施例中,基于前述方案,基于误差函数Tripletloss训练所述训练数据集,包括:根据以下公式训练所述训练数据集,其中,a表示所述训练锚样例,p表示所述训练正样例,n表示所述训练负样例,表示所述训练正样例和所述训练锚样例之间的第一欧式距离,表示所述训练负样例和所述训练锚样例之间的第二欧式距离,α是指所述第二欧式距离和所述第一欧式距离之间的距离之间的最小间隔。在本专利技术的一些实施例中,基于前述方案,所述神经网络模型包括密集连接卷积网络模型。本专利技术实施例的第二方面,提供了一种身份识别装置,包括:语言特征数据获取模块,用于对待识别用户的音频片段进行预处理获得第一语音特征数据;声纹特征确定模块,用于基于神经网络模型,根据所述第一语音特征数据确定待识别声纹特征;身份识别模块,用于将所述待识别声纹特征与预先设置的声纹特征库中的标记声纹特征进行比对,并根据比对结果对所述待识别用户进行身份识别。根据本专利技术实施例的第三方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中第一方面所述的身份识别方法。根据本专利技术实施例的第四方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中第一方面所述的身份识别方法。本专利技术实施例提供的技术方案可以包括以下有益效果:在本专利技术的一些实施例所提供的技术方案中,通过对待识别用户的音频片段进行预处理获得语音特征数据,以进一步地,将语音特征数据输入训练后的神经网络模型,并根据神经网络模型的输出确定待识别声纹特征。一方面,基于经过大数据训练后的神经网络模型能够获得对待识别用户的深层表示特征,从而扩展声纹特征维度,从而使得待测试声纹特征能够更全面且准确地反映待识别用户的特征,有利于提高身份识别的准确性。另一方面,预先设置的声纹特征库中的标记声纹特征也可以基于上述经过大数据训练后的神经网络模型确定,从而,有利于增加不同的标记声纹之间的差异度,进而有利于提高对待测试用户进行身份识别的准确性和稳定性。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本专利技术。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:图1示出了根据本专利技术的实施例的身份识别方法的流程示意图;图2示意性示出了根据本专利技术实施例的另一身份识别方法的流程示意图;图3示意性示出了根据本专利技术实施例的再一身份识别方法的流程示意图;图4示意性示出了根据本专利技术实施例的又一身份识别方法的流程示意图;图5示意性示出了根据本专利技术实施例的声纹特征确定方法的流程示意图;图6示意性示出了根据本专利技术实施例的又一身份识别方法的流程示意图;图7示出了根据本专利技术的实施例的身份识别装置的结构示意图;图8示出了适于用来实现本专利技术实施例的电子设备的本文档来自技高网...

【技术保护点】
1.一种身份识别方法,其特征在于,包括:对待识别用户的音频片段进行预处理获得第一语音特征数据;基于神经网络模型,根据所述第一语音特征数据确定待识别声纹特征;将所述待识别声纹特征与预先设置的声纹特征库中的标记声纹特征进行比对,并根据比对结果对所述待识别用户进行身份识别。

【技术特征摘要】
1.一种身份识别方法,其特征在于,包括:对待识别用户的音频片段进行预处理获得第一语音特征数据;基于神经网络模型,根据所述第一语音特征数据确定待识别声纹特征;将所述待识别声纹特征与预先设置的声纹特征库中的标记声纹特征进行比对,并根据比对结果对所述待识别用户进行身份识别。2.根据权利要求1所述的身份识别方法,其特征在于,对待识别用户的音频片段进行预处理获得第一语音特征数据,包括:根据对待识别用户的音频片段的频率分析,对所述音频片段分帧处理获得M个音频帧;获取所述M个音频帧对应的梅尔频率倒谱系数MFCC特征,其中每个音频帧的MFCC特征包含N维;根据所述MFCC特征确定所述音频片段对应的第一语音特征数据,其中所述第一语音特征数据为M*N维,M、N为正整数。3.根据权利要求2所述的身份识别方法,其特征在于,在对待识别用户的音频片段进行预处理获得第一语音特征数据之前,还包括:通过音频采集设备采集所述待测试用户的原始音频片段;利用频域维纳滤波方法对所述原始音频片段的信道噪声进行去噪处理,得到去噪后的音频片段;获取符合预设条件的去噪后的音频片段。4.根据权利要求1至3任一项所述的身份识别方法,其特征在于,基于神经网络模型,根据所述第一语音特征数据确定待识别声纹特征,包括:根据所述第一语音特征数据获取测试锚样例和测试正样例,根据不同于所述第一语音特征数据的第二语音特征数据获取测试负样例;训练神经网络模型,并将所述测试锚样例、所述测试正样例和所述测试负样例输入训练后的神经网络模型;根据所述训练后的神经网络模型的输出确定待识别声纹特征。5.根据权利要求4所述的身份识别方法,其特征在于,根据所述第一语音特征数据获取测试锚样例和测试正样例,根据不同于所述第一语音特征数据的第二语音特征数据获取测试负样例,包括:将所述第一语音特征数据输入第一神经网络模型进行特征融合得到测试锚样例;将所述第一语音特征数据输入第二神经网络模型进行特征融合得到测...

【专利技术属性】
技术研发人员:刘兴旺
申请(专利权)人:泰康保险集团股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1