一种声纹注册方法、装置及设备制造方法及图纸

技术编号:39051230 阅读:18 留言:0更新日期:2023-10-12 19:43
本发明专利技术公开了声纹注册技术领域的一种声纹注册方法、装置及设备,包括:通过录音设备记录说话人的语音数据,采集的语音数据进行语音识别,获得语音识别结果,对语音数据存储;对获取的语音样本切分为长度相同的语音帧;将语音识别得到的语音识别结果与随机内容进行比对,保存比对结果一致的语音数据作为原始文件;获取每条语音段中每个语音帧的声纹识别特征,并于声纹注册的录音文件进行声纹注册,该声纹注册方法、装置及设备,结构设计合理,能够使注册的声纹质量提高,语言采集的数据更的精准,能够在用户声音出现变化的情况下,能够精准识别,避免因声音的变化导致声纹的录制失败,能够一次性完成声纹的录制,无需反复注册。无需反复注册。无需反复注册。

【技术实现步骤摘要】
一种声纹注册方法、装置及设备


[0001]本专利技术涉及声纹注册
,具体为一种声纹注册方法、装置及设备。

技术介绍

[0002]声纹,是用电声学仪器显示的携带言语信息的声波频谱。现代科学研究表明,声纹不仅具有特定性,而且有相对稳定性的特点,因此能够用于身份识别或者验证随着计算机技术的不断发展,语音对话系统得到了广泛地应用,目前,需要使用预先注册的诸如声纹嵌入码等特征来实现语音。
[0003]现有声纹信息采集,主要是通过麦克风进行一段语音录制保存为语音文件由于不同的麦克风、环境噪音等因素的差异,造成注册的声纹质量参差不齐,导致语言采集的数据不够精准,同时声纹注册过程不但繁琐,并且当用户声音发生变化时,会造成声纹识别失败,需要反复的重新注册,为此我们提出了一种声纹注册方法、装置及设备。

技术实现思路

[0004]本专利技术的目的在于提供一种声纹注册方法、装置及设备,以解决上述
技术介绍
中提出了现有声纹信息采集,主要是通过麦克风进行一段语音录制保存为语音文件由于不同的麦克风、环境噪音等因素的差异,造成注册的声纹质量参差不齐,导致语言采集的数据不够精准,同时声纹注册过程不但繁琐,并且当用户声音发生变化时,会造成声纹识别失败,需要反复的重新注册的问题。
[0005]为实现上述目的,本专利技术提供如下技术方案:一种声纹注册方法、装置及设备,包括:通过录音设备记录说话人的语音数据,采集的语音数据进行语音识别,获得语音识别结果,对语音数据存储;对获取的语音样本切分为长度相同的语音帧;将语音识别得到的语音识别结果与随机内容进行比对,保存比对结果一致的语音数据作为原始文件;获取每条语音段中每个语音帧的声纹识别特征,并于声纹注册的录音文件进行声纹注册。
[0006]优选的,所述的采集的语音数据进行语音识别,根据性别分类器和语音确定用户的性别,同时重复采集的语音数据三次以上。
[0007]优选的,所述的对获取的语音样本切分为长度相同的语音帧,根据语音样本对应的所有有效的声纹嵌入码获得说话人的注册声纹嵌入码,将每条语音段切分为长度相同且彼此重叠的多个语音帧。
[0008]优选的,确定目标的语音特征对应非注册用户,且新的语音特征与目标语音特征向量簇的向量距离大于或者等于设定阈值时,将目标新的语音特征加入至目标语音特征向量簇中,得到新的目标语音特征向量簇。
[0009]优选的,根据每条语音段的声纹嵌入码的所有相似度和预设的相似度阈值确定有效的声纹嵌入码,根据语音样本对应的所有有效的声纹嵌入码获得说话人的注册声纹嵌入码。
[0010]优选的,根据多个语音段的所有相似度和预设的相似度阈值,确定第一语音段的声音嵌入码的置信度,在第一语音段的声音嵌入码的置信度大于或等于预设置信度阈值时,确定第一语音段的声音嵌入码有效,在第一语音段的声音嵌入码的置信度小于预设置信度阈值时,确定第一语音段的声音嵌入码无效。
[0011]语言识别模块,用于记录说话人的语音数据,采集的语音数据进行语音识别;数据处理模块,用于处理获取的语音样本切分为长度相同的语音帧;识别模块,用于语音识别得到的语音识别结果与随机内容进行比对;注册模块,用于声纹注册的录音文件进行声纹注册。
[0012]一个或多个存储器,存储器存储执行指令;存储装置,存储装置执行存储器存储的执行指令,使得处理器执行如权利要求1至7中任一项所述的方法。
[0013]与现有技术相比,本专利技术的有益效果是:该声纹注册方法、装置及设备,通过性别分类器和语音确定用户的性别,同时重复采集的语音数据三次以上,对获取的语音样本切分为长度相同的语音帧,根据语音样本对应的所有有效的声纹嵌入码获得说话人的注册声纹嵌入码,将每条语音段切分为长度相同且彼此重叠的多个语音帧,根据语音样本对应的所有有效的声纹嵌入码获得说话人的注册声纹嵌入码,从而能够使注册的声纹质量提高,语言采集的数据更的精准。
[0014]该声纹注册方法、装置及设备,通过对多个语音段的所有相似度和预设的相似度阈值,确定第一语音段的声音嵌入码的置信度,在第一语音段的声音嵌入码的置信度大于或等于预设置信度阈值时,确定第一语音段的声音嵌入码有效,在第一语音段的声音嵌入码的置信度小于预设置信度阈值时,确定第一语音段的声音嵌入码无效,从而能够在用户声音出现变化的情况下,能够精准识别,避免因声音的变化导致声纹的录制失败,能够一次性完成声纹的录制,无需反复注册。
附图说明
[0015]图1为本专利技术实施例提供的一种声纹注册方法流程图;图2为本专利技术实施例提供的一种声纹注册装置结构示意图;
实施方式
[0016]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
实施例
[0017]请参阅图1

2,本专利技术提供一种技术方案:一种声纹注册方法、装置及设备,包括:
通过录音设备记录说话人的语音数据,采集的语音数据进行语音识别,获得语音识别结果,对语音数据存储;对获取的语音样本切分为长度相同的语音帧;将语音识别得到的语音识别结果与随机内容进行比对,保存比对结果一致的语音数据作为原始文件;获取每条语音段中每个语音帧的声纹识别特征,并于声纹注册的录音文件进行声纹注册。
[0018]所述的采集的语音数据进行语音识别,根据性别分类器和语音确定用户的性别,同时重复采集的语音数据三次以上。
[0019]所述的对获取的语音样本切分为长度相同的语音帧,根据语音样本对应的所有有效的声纹嵌入码获得说话人的注册声纹嵌入码,将每条语音段切分为长度相同且彼此重叠的多个语音帧。
[0020]确定目标的语音特征对应非注册用户,且新的语音特征与目标语音特征向量簇的向量距离大于或者等于设定阈值时,将目标新的语音特征加入至目标语音特征向量簇中,得到新的目标语音特征向量簇。
[0021]根据每条语音段的声纹嵌入码的所有相似度和预设的相似度阈值确定有效的声纹嵌入码,根据语音样本对应的所有有效的声纹嵌入码获得说话人的注册声纹嵌入码。
[0022]根据多个语音段的所有相似度和预设的相似度阈值,确定第一语音段的声音嵌入码的置信度,在第一语音段的声音嵌入码的置信度大于或等于预设置信度阈值时,确定第一语音段的声音嵌入码有效,在第一语音段的声音嵌入码的置信度小于预设置信度阈值时,确定第一语音段的声音嵌入码无效。
[0023]通过性别分类器和语音确定用户的性别,同时重复采集的语音数据三次以上,对获取的语音样本切分为长度相同的语音帧,根据语音样本对应的所有有效的声纹嵌入码获得说话人的注册声纹嵌入码,将每条语音段切分为长度相同且彼此重叠的多个语音帧,根据语音样本对应的所有有效的声纹嵌入码获得说话人的注册声纹嵌入码,从而能够使注册的声纹质量提高,语言采集的数据更的精准。...

【技术保护点】

【技术特征摘要】
1.一种声纹注册方法,其特征在于:包括:通过录音设备记录说话人的语音数据,采集的语音数据进行语音识别,获得语音识别结果,对语音数据存储;对获取的语音样本切分为长度相同的语音帧;将语音识别得到的语音识别结果与随机内容进行比对,保存比对结果一致的语音数据作为原始文件;获取每条语音段中每个语音帧的声纹识别特征,并于声纹注册的录音文件进行声纹注册。2.根据权利要求1所述的一种声纹注册方法,其特征在于:所述的采集的语音数据进行语音识别,根据性别分类器和语音确定用户的性别,同时重复采集的语音数据三次以上。3.根据权利要求1所述的一种声纹注册方法,其特征在于:所述的对获取的语音样本切分为长度相同的语音帧,根据语音样本对应的所有有效的声纹嵌入码获得说话人的注册声纹嵌入码,将每条语音段切分为长度相同且彼此重叠的多个语音帧。4.根据权利要求3所述的一种声纹注册方法,其特征在于:确定目标的语音特征对应非注册用户,且新的语音特征与目标语音特征向量簇的向量距离大于或者等于设定阈值时,将目标新的语音特征加入至目标语音特征向量簇中,得到新的目标语音特征向量簇。5.根据...

【专利技术属性】
技术研发人员:班荣军
申请(专利权)人:安徽声云智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1