基于声纹识别的远程授权方法、系统、设备及存储介质技术方案

技术编号:27835100 阅读:21 留言:0更新日期:2021-03-30 11:56
本发明专利技术提供了基于声纹识别的远程授权方法、系统、设备及存储介质,该方法包括:接到用户的语音,客服与用户进行预设认证问题的问答;实时将接收到的用户语音的实时音频根据预设时长为单位切割为多段子音频;自子音频提取音频特征,输入深度学习网络,获得子音频的声纹特征信息;将每段子音频的声纹特征信息与该用户预存的声纹特征信息进行余弦相似度比较,获得相似度值;判断相似度平均值是否满足预设相似度阈值,若是,则认证成功,用户获得预设授权;本发明专利技术能够直接将授权者授权的订单进行处理,实现自动化,节省大量人力,在授权者口头授权的过程中完成身份认证,完善安全检测环节,维护用户利益。维护用户利益。维护用户利益。

【技术实现步骤摘要】
基于声纹识别的远程授权方法、系统、设备及存储介质


[0001]本专利技术涉及远程授权领域,具体地说,涉及基于声纹识别的远程授权方法、系统、设备及存储介质。

技术介绍

[0002]声纹识别是生物识别技术的一种,也即说话人识别,可分为说话人辨认与说话人确认,文本相关与文本无关。说话人辨认是判断某段语音是若干说话人中的哪一个,即1对多的问题;说话人确认是判断某段音频是否为某个指定的说话人所说,即1对1的问题。不同场景使用不同的声纹识别技术。文本相关要求说话人按照规定的内容发音,而文本无关的识别系统不限制说话人的说话内容。前者识别效果较好,后者应用广泛、用户体验较好但模型建立相对困难。
[0003]人在讲话时使用的多个发声器官在尺寸和形态方面各不相同,因此任何两个人的声纹均不相同,且获取语音的成本较低,授权者在说话过程中便完成身份认证及授权,因此授权者的接受度较高,但存在冒用风险。在口头授权场景下存在非授权者冒用授权者身份进行电话授权的行为,在真实授权者未知的情况下,该行为严重损害双方利益。因此本专利技术基于说话人识别的深度学习模型判断实时进线或去电的音频说话人是否为该公司委任的授权者。在授权者进线或去电的过程中,音频会以数据流的形式实时传输给系统,本系统对已经进入的数据流进行处理并返回当前判别结果给客服PC端,客服依据PC端显示的实时结果对授权者采取不同的处理及对话方案。
[0004]因此,本专利技术提供了一种基于声纹识别的远程授权方法、系统、设备及存储介质。

技术实现思路

[0005]针对现有技术中的问题,本专利技术的目的在于提供基于声纹识别的远程授权方法、系统、设备及存储介质,克服了现有技术的困难,能够直接将授权者授权的订单进行处理,实现自动化,节省大量人力,在授权者口头授权的过程中完成身份认证,完善安全检测环节,维护用户利益。
[0006]本专利技术的实施例提供一种基于声纹识别的远程授权方法,包括以下步骤:
[0007]S110、接到所述用户的语音,客服与所述用户进行预设认证问题的问答;
[0008]S120、实时将接收到的用户语音的实时音频根据预设时长为单位切割为多段子音频;
[0009]S130、自所述子音频提取音频特征,输入深度学习网络,获得所述子音频的声纹特征信息;
[0010]S140、将每段所述子音频的声纹特征信息与该用户预存的声纹特征信息进行余弦相似度比较,获得相似度值;
[0011]S170、判断所述相似度平均值是否满足预设相似度阈值,若是,则执行步骤S180,若否,则执行步骤S190;
[0012]S180、认证成功,所述用户获得预设授权;
[0013]S190、认证失败,返回步骤S120。
[0014]优选地,所述步骤S110之前还包括以下步骤:
[0015]S100、预存每位用户的账户以及与所述账户关联的预设授权、声纹特征信息、预设认证问题、相似度阈值。
[0016]优选地,所述步骤S110中还包括对用户语音与客服语音进行分离,分别对客服语音的第一语音信息和用户语音的第二语音信息进行音频到文本的识别获得第一文本和第二文本。
[0017]优选地,所述步骤S120中包括根据所述子音频的时序对应转写第二文本,获得每段所述子音频对应的子文本。
[0018]优选地,所述步骤S120中还包括向每一段子音频输入电话背景音的反向波形,抑制背景音。
[0019]优选地,所述步骤S120中还包括将时长不满足预设时长的子音频进行局部复制以满足预设时长。
[0020]优选地,所述步骤S140之后,步骤S170之前还包括以下步骤:
[0021]S150、根据当前所有所述子音频的子文本的总字数对每段所述子音频的相似度值进行加权平均获得相似度平均值,所述子文本的总字数与所述相似度值的加权平均的权重成正向增长。
[0022]优选地,所述步骤S150之后,步骤S170之前还包括以下步骤:
[0023]S160、根据所述判断第一文本找到对应的预设认证问题,根据所述第一文本与所述第二文本的时序关系,当所述第二文本匹配所述预设认证问题对应的答案时,则提高所述相似度平均值,匹配所述预设认证问题的数量与所述相似度平均值提升的比例正相关。预设认证问题正确数占比与相似度之间是加权平均,比如a*相似度+(1

a)*问题正确回答数量。
[0024]优选地,所述步骤S180中还包括获得预存的所述声纹特征信息的第一质量评估分值以及当前所述用户语音的实时音频的第二质量评估分值,当所述第二质量评估分值大于所述第一质量评估分值时,将所述实时音频的声纹特征信息替换预存的所述声纹特征信息。
[0025]优选地,预设时长的取值范围是1秒至10秒,例如:1秒、2秒、3秒、4秒、5秒、6秒、7秒、8秒、9秒、10秒等。
[0026]本专利技术的实施例还提供一种基于声纹识别的远程授权系统,用于实现上述的基于声纹识别的远程授权方法,所述基于声纹识别的远程授权系统包括:
[0027]通话模块,接到所述用户的语音,客服与所述用户进行预设认证问题的问答;
[0028]切割模块,实时将接收到的用户语音的音频根据预设时长为单位切割为多段子音频;
[0029]提取模块,自所述子音频提取音频特征,输入深度学习网络,获得所述子音频的声纹特征信息;
[0030]评估模块,将每段所述子音频的声纹特征信息与该用户预存的声纹特征信息进行余弦相似度比较,获得相似度值;
[0031]判断模块,判断所述相似度平均值是否满足预设相似度阈值,若是,则执行认证模块,若否,则执行拒绝模块;
[0032]认证模块,认证成功,所述用户获得预设授权;
[0033]拒绝模块,认证失败,返回切割模块。
[0034]本专利技术的实施例还提供一种基于声纹识别的远程授权设备,包括:
[0035]处理器;
[0036]存储器,其中存储有所述处理器的可执行指令;
[0037]其中,所述处理器配置为经由执行所述可执行指令来执行上述基于声纹识别的远程授权方法的步骤。
[0038]本专利技术的实施例还提供一种计算机可读存储介质,用于存储程序,所述程序被执行时实现上述基于声纹识别的远程授权方法的步骤。
[0039]本专利技术的目的在于提供基于声纹识别的远程授权方法、系统、设备及存储介质,能够直接将授权者授权的订单进行处理,实现自动化,节省大量人力,在授权者口头授权的过程中完成身份认证,完善安全检测环节,维护用户利益,并且能够减少授权者与客服机器人间为确认身份产生的多个问题,降低客服机器人出错的可能,并且减少授权者对客服机器人的排斥,提升用户体验。
附图说明
[0040]通过阅读参照以下附图对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显。
[0041]图1是本专利技术的基于声纹识别的远程授权方法的流程图。
[0042]图2至4是实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于声纹识别的远程授权方法,其特征在于,包括以下步骤:S110、接到所述用户的语音,客服与所述用户进行预设认证问题的问答;S120、实时将接收到的用户语音的实时音频根据预设时长为单位切割为多段子音频;S130、自所述子音频提取音频特征,输入深度学习网络,获得所述子音频的声纹特征信息;S140、将每段所述子音频的声纹特征信息与该用户预存的声纹特征信息进行余弦相似度比较,获得相似度值;S170、判断所述相似度平均值是否满足预设相似度阈值,若是,则执行步骤S180,若否,则执行步骤S190;S180、认证成功,所述用户获得预设授权;S190、认证失败,返回步骤S120。2.根据权利要求1所述的基于声纹识别的远程授权方法,其特征在于,所述步骤S110之前还包括以下步骤:S100、预存每位用户的账户以及与所述账户关联的预设授权、声纹特征信息、预设认证问题、相似度阈值。3.根据权利要求1所述的基于声纹识别的远程授权方法,其特征在于,所述步骤S110中还包括对用户语音与客服语音进行分离,分别对客服语音的第一语音信息和用户语音的第二语音信息进行音频到文本的识别获得第一文本和第二文本。4.根据权利要求3所述的基于声纹识别的远程授权方法,其特征在于,所述步骤S120中包括根据所述子音频的时序对应转写第二文本,获得每段所述子音频对应的子文本。5.根据权利要求3所述的基于声纹识别的远程授权方法,其特征在于,所述步骤S120中还包括向每一段子音频输入电话背景音的反向波形,抑制背景音。6.根据权利要求3所述的基于声纹识别的远程授权方法,其特征在于,所述步骤S120中还包括将时长不满足预设时长的子音频进行局部复制以满足预设时长。7.根据权利要求1所述的基于声纹识别的远程授权方法,其特征在于,所述步骤S140之后,步骤S170之前还包括以下步骤:S150、根据当前所有所述子音频的子文本的总字数对每段所述子音频的相似度值进行加权平均获得相似度平均值,所述子文本的总字...

【专利技术属性】
技术研发人员:李亚枫任君罗超胡泓李巍
申请(专利权)人:携程计算机技术上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1