一种语音验证处理的方法以及相关装置制造方法及图纸

技术编号:33895319 阅读:14 留言:0更新日期:2022-06-22 17:31
本申请实施例公开了一种语音验证处理的方法以及相关装置,可应用于人工智能等领域,能够有效地提高与待验证语音对应的说话对象的识别准确度,提升用户体验程度。前述方法包括:获取终端设备发送的待验证信息,待验证信息包括待验证语音、对象标识码以及设备标识码;通过预设模型版本号所对应的神经网络模型确定待验证语音所对应的声纹特征向量;计算声纹特征向量与每个候选声纹特征向量之间的声纹相似度;从声纹特征向量与每个候选声纹特征向量之间的声纹相似度中确定目标声纹相似度;在目标声纹相似度大于或等于预设相似阈值时,向终端设备发送验证通过消息,验证通信消息包括对象标识码。括对象标识码。括对象标识码。

【技术实现步骤摘要】
一种语音验证处理的方法以及相关装置


[0001]本申请实施例涉及音频识别处理
,具体涉及一种语音验证处理的方法以及相关装置。

技术介绍

[0002]在目标对象的身份识别或者验证等场景中,通常需要对不同对象的声音进行验证,进而根据声纹识别的结果来判断验证是否成功。
[0003]在相关方案中,大都是在终端设备中采用离线声纹识别的方式,通过对音频特征进行简单的匹配来实现对象的声音的识别。然而,终端设备易受到硬件资源的限制,使得简单的音频特征匹配的识别方式会导致说明对象的识别准确度较低,进而导致用户体验欠佳。

技术实现思路

[0004]本申请实施例提供了一种语音验证处理的方法以及相关装置,能够有效地提高与待验证语音对应的说话对象的识别准确度,提升用户体验程度;并且将声纹验证处理的过程部署在声纹验证服务器中进行,而不是部署在终端设备中,使得该语音验证的方法能够有效地摆脱终端设备的硬件资源限制,使得终端设备能够支持更多的说话对象进行语音录入,进而实现对更多的说话对象的识别。
[0005]第一方面,本申请实施例提供了一种语音验证处理的方法。该方法可以应用于声纹验证服务器。该方法包括:获取终端设备发送的待验证信息,待验证信息包括待验证语音、对象标识码以及设备标识码,其中,对象标识码用于标识说出待验证语音时的目标对象,设备标识码用于标识录入待验证语音时的终端设备;通过预设模型版本号所对应的神经网络模型确定待验证语音所对应的声纹特征向量;计算声纹特征向量与每个候选声纹特征向量之间的声纹相似度,其中,每个候选声纹特征向量为每个说话对象通过终端设备录入各自的语音数据时,基于预设模型版本号所对应的神经网络模型确定的声纹特征向量,说话对象包括目标对象;从声纹特征向量与每个候选声纹特征向量之间的声纹相似度中确定目标声纹相似度;在目标声纹相似度大于或等于预设相似阈值时,向终端设备发送验证通过消息,验证通过消息包括对象标识码,验证通过消息用于指示待验证语音验证成功。
[0006]第二方面,本申请实施例提供了另一种语音验证处理的方法。该方法应用于终端设备。该方法包括:获取与目标对象对应的待验证语音;向声纹验证服务器发送待验证信息,待验证信息包括待验证语音、对象标识码以及设备标识码,其中,待验证信息用于声纹验证服务器对待验证语音进行验证处理,对象标识码用于标识目标对象,设备标识码用于标识录入待验证语音时的终端设备;接收声纹验证服务器发送的验证通过消息,其中,验证通过消息由声纹验证服务器在目标声纹相似度大于或等于预设相似阈值时发送,目标声纹相似度由待验证语音所对应的声纹特征向量与每个候选声纹特征向量之间的声纹相似度中确定得到,验证通过消息包括对象标识码;基于验证通过消息确定待验证语音验证成功。
[0007]第三方面,本申请实施例提供一种声纹验证服务器。该声纹验证服务器包括:获取单元、处理单元以及发送单元。其中,获取单元,用于获取终端设备发送的待验证信息,待验证信息包括待验证语音、对象标识码以及设备标识码,其中,对象标识码用于标识说出待验证语音时的目标对象,设备标识码用于标识录入待验证语音时的终端设备。处理单元用于:通过预设模型版本号所对应的神经网络模型确定待验证语音所对应的声纹特征向量;计算声纹特征向量与每个候选声纹特征向量之间的声纹相似度,其中,每个候选声纹特征向量为每个说话对象通过终端设备录入各自的语音数据时,基于预设模型版本号所对应的神经网络模型确定的声纹特征向量,说话对象包括目标对象;从声纹特征向量与每个候选声纹特征向量之间的声纹相似度中确定目标声纹相似度。发送单元用于在目标声纹相似度大于或等于预设相似阈值时,向终端设备发送验证通过消息,验证通过消息包括对象标识码,验证通过消息用于指示待验证语音验证成功。
[0008]在一些可选的实施方式中,获取单元还用于获取更新后的模型版本号。处理单元还用于基于更新后的模型版本号所对应的神经网络模型,更新每个终端设备中的每个说话对象的语音数据所对应的声纹特征向量。
[0009]在一些可选的实施方式中,处理单元还用于:将设备标识码、对象标识码以及更新后的模型版本号进行绑定处理,得到第一绑定关系,并存储第一绑定关系。
[0010]在一些可选的实施方式中,验证通过消息包括目标声纹特征向量,目标声纹特征向量与目标声纹相似度对应,目标声纹特征向量用于指示终端设备获取目标对象输入的其他语音命令。
[0011]在一些可选的实施方式中,发送单元还用于:在目标声纹相似度小于预设相似阈值时,则向终端设备发送验证失败消息,验证失败消息用于提示待验证语音验证失败。
[0012]在一些可选的实施方式中,处理单元用于:从声纹特征向量与每个候选声纹特征向量之间的声纹相似度中确定最大值的声纹相似度;将最大值的声纹相似度作为目标声纹相似度。
[0013]第四方面,本申请实施例提供了一种终端设备。该终端设备可以包括获取单元、处理单元以及发送单元。其中,获取单元用于获取与目标对象对应的待验证语音。发送单元用于向声纹验证服务器发送待验证信息,待验证信息包括待验证语音、对象标识码以及设备标识码,其中,待验证信息用于声纹验证服务器对待验证语音进行验证处理,对象标识码用于标识目标对象,设备标识码用于标识录入待验证语音时的终端设备。获取单元用于接收声纹验证服务器发送的验证通过消息,其中,验证通过消息由声纹验证服务器在目标声纹相似度大于或等于预设相似阈值时发送,目标声纹相似度由待验证语音所对应的声纹特征向量与每个候选声纹特征向量之间的声纹相似度中确定得到,验证通过消息包括对象标识码。处理单元用于基于验证通过消息确定待验证语音验证成功。
[0014]在一些可选的实施方式中,验证通过消息包括目标声纹特征向量,目标声纹特征向量与目标声纹相似度对应。获取单元还用于基于目标声纹特征向量获取目标对象输入的其他语音命令。
[0015]在一些可选的实施方式中,获取单元还用于接收声纹验证服务器发送的验证失败消息,其中,验证失败消息由声纹验证服务器在目标声纹相似度小于预设相似阈值时发送。处理单元还用于基于验证失败消息确定待验证语音验证失败。
[0016]本申请实施例第五方面提供了一种语音验证处理装置,该语音验证处理装置可以包括但不限于上述第三方面中的声纹验证服务器,第四方面中的终端设备等。该语音验证处理装置包括:存储器、输入/输出(I/O)接口和存储器。存储器用于存储程序指令。处理器用于执行存储器中的程序指令,以执行上述第一方面的实施方式对应的语音验证处理的方法;或者执行上述第二方面的实施方式对应的语音验证处理的方法。
[0017]本申请实施例第六方面提供了一种计算机可读存储介质,计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行以执行上述第一方面的实施方式对应的方法;或者执行上述第二方面的实施方式对应的语音验证处理的方法。
[0018]本申请实施例第七方面提供了一种包含指令的计算机程序产品,当其在计算机或者处理器上运行时,使得计算机或者处理器执行上述以执本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音验证处理的方法,其特征在于,应用于声纹验证服务器,包括:获取终端设备发送的待验证信息,所述待验证信息包括待验证语音、对象标识码以及设备标识码,其中,所述对象标识码用于标识说出所述待验证语音时的目标对象,所述设备标识码用于标识录入所述待验证语音时的所述终端设备;通过预设模型版本号所对应的神经网络模型确定所述待验证语音所对应的声纹特征向量;计算所述声纹特征向量与每个候选声纹特征向量之间的声纹相似度,其中,每个所述候选声纹特征向量为每个说话对象通过所述终端设备录入各自的语音数据时,基于所述预设模型版本号所对应的神经网络模型确定的声纹特征向量,所述说话对象包括所述目标对象;从所述声纹特征向量与每个候选声纹特征向量之间的声纹相似度中确定目标声纹相似度;在所述目标声纹相似度大于或等于预设相似阈值时,向所述终端设备发送验证通过消息,所述验证通过消息包括所述对象标识码,所述验证通过消息用于指示所述待验证语音验证成功。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取更新后的模型版本号;基于所述更新后的模型版本号所对应的神经网络模型,更新每个所述终端设备中的每个说话对象的语音数据所对应的声纹特征向量。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:将所述设备标识码、所述对象标识码以及所述更新后的模型版本号进行绑定处理,得到第一绑定关系;存储所述第一绑定关系。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述验证通过消息包括目标声纹特征向量,所述目标声纹特征向量与所述目标声纹相似度对应,所述目标声纹特征向量用于指示所述终端设备获取所述目标对象输入的其他语音命令。5.根据权利要求1至3中任一项所述的方法,其特征在于,所述方法还包括:在所述目标声纹相似度小于所述预设相似阈值时,则向所述终端设备发送验证失败消息,所述验证失败消息用于提示所述待验证语音验证失败。6.根据权利要求1至3中任一项所述的方法,其特征在于,所述从所述声纹特征向量与每个候选声纹特征向量之间的声纹相似度中确定目标声纹相似度,包括:从所述声纹特征向量与每个候选声纹特征向量之间的声纹相似度中确定最大值的声纹相似度;将所述最大值的声纹相似度作为所述目标声纹相似度。7.一种语音验证处理的方法,其特征在于,应用于终端设备,包括:获取与目标对象对应的待验证语音;向声纹验证服务器发送待验证信息,所述待验证信息包括所述待验证语音、对象标识码以及设备标识码,其中,所述待验证信息用于所述声纹验证服务器对所述待验证语音进行验证处理,所述对象标识码用于标识所述目标对象,所述设备标识码用于标识录入所述

【专利技术属性】
技术研发人员:朱绍明袁添文杜念冬唐立亮
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1