当前位置: 首页 > 专利查询>陈晶专利>正文

一种基于人工智能的语音呼叫处理方法及系统技术方案

技术编号:33838456 阅读:35 留言:0更新日期:2022-06-16 11:59
本申请实施例提供的一种基于人工智能的语音呼叫处理方法及系统,通过确定的第一待处理片段化音频数据的原始用户声纹描述,然后通过多组第一待处理片段化音频数据的片段化音频数据分布对多个原始用户声纹描述进行整理,可以得到目标用户声纹描述。进而,通过整理后的目标用户声纹描述对第一待处理片段化音频数据中的待进行安全分析的语音交互终端进行识别,能够实现通过目标用户声纹描述,确定目标用户声纹描述与实际的待进行安全分析的语音交互终端对应的目标用户声纹描述之间的对比分析情况,可以准确、可靠地确定出待进行安全分析的语音交互终端的语音会话信息是否为机器合成的,进而保障呼叫安全分析情况的精度和可信度。和可信度。和可信度。

【技术实现步骤摘要】
一种基于人工智能的语音呼叫处理方法及系统


[0001]本申请涉及语音处理
,特别涉及一种基于人工智能的语音呼叫处理方法及系统。

技术介绍

[0002]随着移动互联网的快速发展,通过语音进行交互的方式越来越频繁,这样可以在一定程度上丰富人们的生活,但同时也存在着一些风险。比如:通过手机、平板电话等终端所生成的语音信息可能是通过机器合成的。这样的语音信息可能会存在电话诈骗、传播造假信息等。因此,为了避免出现上述问题,需要对手机、平板电话等终端所生成的语音信息进行安全分析。然而专利技术人经研究发现,相关语音信息分析方案还存在一些待改进的地方,比如针对机器合成的安全分析技术而言,现目前难以保障其精度和可信度。

技术实现思路

[0003]为改善相关技术中存在的技术问题,本申请提供了一种基于人工智能的语音呼叫处理方法及系统。
[0004]第一方面,本申请实施例提供了一种基于人工智能的语音呼叫处理方法,应用于基于人工智能的语音呼叫处理云平台,所述方法至少包括:确定待进行安全分析的语音交互终端对应的第一语音会话信息;从第一语音会话信息中确定多组第一待处理片段化音频数据,并确定每组第一待处理片段化音频数据的原始用户声纹描述;所述原始用户声纹描述包括所述第一待处理片段化音频数据在呼叫场景层面下的用户声纹描述;依据所述多组第一待处理片段化音频数据在所述第一语音会话信息中的片段化音频数据分布,将每组第一待处理片段化音频数据的原始用户声纹描述进行整理,得到目标用户声纹描述;通过所述目标用户声纹描述,确定所述第一语音会话信息中的所述待进行安全分析的语音交互终端的呼叫安全分析情况。
[0005]如此设计,通过确定的第一待处理片段化音频数据的原始用户声纹描述,不仅能够得到第一待处理片段化音频数据的基础用户声纹描述,比如,得到可以反映第一待处理片段化音频数据的声纹特征和/或第一待处理片段化音频数据中的每个主题信息的类别描述的用户声纹描述,还可以得到在呼叫场景层面下的用户声纹描述,提高了确定的用户声纹描述的多样性和完整度,然后通过多组第一待处理片段化音频数据的片段化音频数据分布对多个原始用户声纹描述进行整理,可以得到涵盖先后关系标签的目标用户声纹描述。进而,通过整理后的目标用户声纹描述对第一待处理片段化音频数据中的待进行安全分析的语音交互终端进行识别,能够实现通过目标用户声纹描述,确定目标用户声纹描述与实际的待进行安全分析的语音交互终端对应的目标用户声纹描述之间的对比分析情况,其中,对比分析情况可以包括先后关系标签的比对分析数据以及用户声纹描述之间的对比分析情况,进而,通过确定出对比分析情况,可以准确、可靠地确定出待进行安全分析的语音交互终端的语音会话信息是否为机器合成的,进而保障呼叫安全分析情况的精度和可信
度。
[0006]在一种可能的实施例中,所述第一语音会话信息包括在多种噪声环境下采集的所述待进行安全分析的语音交互终端的片段化音频数据;所述从第一语音会话信息中确定多组第一待处理片段化音频数据,包括:从所述第一语音会话信息中确定出所述多种噪声环境中每种噪声环境对应的至少一组片段化音频数据,得到多组所述第一待处理片段化音频数据。
[0007]如此一来,不同噪声环境加载在待进行安全分析的语音交互终端中所达到的效果不同,因此,同一待进行安全分析的语音交互终端在不同噪声环境下对应的第一待处理片段化音频数据的用户声纹描述存在偏差,通过确定的不同噪声环境下的第一待处理片段化音频数据,可以准确地确定出每个第一待处理片段化音频数据中的待进行安全分析的语音交互终端之间的音色特征信息的比对分析数据和用户声纹描述之间的比对分析数据,进而通过确定出的偏差以及实际的待进行安全分析的语音交互终端应携带的比对分析数据,可以准确地确定出待进行安全分析的语音交互终端的呼叫安全分析情况。
[0008]在一种可能的实施例中,在所述通过所述目标用户声纹描述,确定所述第一语音会话信息中的所述待进行安全分析的语音交互终端的呼叫安全分析情况之前,所述方法还包括:从所述第一语音会话信息中确定至少一组第二待处理片段化音频数据,并分别对每组第二待处理片段化音频数据进行显著文本内容识别,分别确定每组第二待处理片段化音频数据中的待进行安全分析的语音交互终端的第一设定交互事件对应的显著文本内容;从所述显著文本内容中确定设定数目的目标显著文本内容;通过每组第二待处理片段化音频数据和每组第二待处理片段化音频数据对应的目标显著文本内容,确定每组第二待处理片段化音频数据中的待进行安全分析的语音交互终端对应的第一识别可能性;所述通过所述目标用户声纹描述,确定所述第一语音会话信息中的所述待进行安全分析的语音交互终端的呼叫安全分析情况,包括:通过每组第二待处理片段化音频数据对应的第一识别可能性和所述目标用户声纹描述,确定所述第一语音会话信息中的所述待进行安全分析的语音交互终端的呼叫安全分析情况。
[0009]如此一来,目标显著文本内容对应的主题信息的描述内容能够显著的表达待进行安全分析的语音交互终端对应的用户声纹描述,通过对一组第二待处理片段化音频数据进行显著文本内容识别,首先能够确定出片段化音频数据中的待进行安全分析的语音交互终端的第一设定交互事件及其对应的显著文本内容,进而可以从中确定出准确的目标显著文本内容。然后,通过目标显著文本内容和第二待处理片段化音频数据对待进行安全分析的语音交互终端进行识别,这样能够实现在识别过程中不仅聚焦第二待处理片段化音频数据对应的整体的用户声纹描述,而且还聚焦目标显著文本内容对应的部分的用户声纹描述,进而能够得到较为精准可信的第一识别可能性。
[0010]在一种可能的实施例中,通过所述目标显著文本内容和所述第二待处理片段化音频数据,确定所述第二待处理片段化音频数据中的待进行安全分析的语音交互终端对应的第一识别可能性,包括:确定所述第一设定交互事件对应的设定词向量;以及通过每个所述目标显著文本内容对应的主题信息的词向量,确定所述第一设定交互事件对应的真实词向量;通过所述设定词向量和所述真实词向量,确定目标映射列表;通过所述目标映射列表,对所述每个所述显著文本内容对应的主题信息进行词向量映射;通过所述第二待处理片段
化音频数据和词向量映射后的每个所述显著文本内容,确定所述第二待处理片段化音频数据中的待进行安全分析的语音交互终端的第一识别可能性。
[0011]如此一来,设定词向量为希望得到的待进行安全分析的语音交互终端的第一设定交互事件对应的目标显著文本内容在第二待处理片段化音频数据中对应的词向量,真实词向量为待进行安全分析的语音交互终端的第一设定交互事件对应的目标显著文本内容在第二待处理片段化音频数据中对应的实际词向量,通过确定的目标映射列表,可以实现对每个显著文本内容对应的主题信息的词向量映射,得到满足要求的词向量,再通过映射后的词向量对待进行安全分析的语音交互终端进行识别,由于映射后的词向量满足要求,因此,能够在一定程度上降低AI模型的配置复杂度,进而能够提高确定的第一识别可能性的准确性。
[0012]在一种本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的语音呼叫处理方法,其特征在于,应用于基于人工智能的语音呼叫处理云平台,所述方法至少包括:确定待进行安全分析的语音交互终端对应的第一语音会话信息;从第一语音会话信息中确定多组第一待处理片段化音频数据,并确定每组第一待处理片段化音频数据的原始用户声纹描述;其中,所述原始用户声纹描述包括所述第一待处理片段化音频数据在呼叫场景层面下的用户声纹描述;依据所述多组第一待处理片段化音频数据在所述第一语音会话信息中的片段化音频数据分布,将每组第一待处理片段化音频数据的原始用户声纹描述进行整理,得到目标用户声纹描述;通过所述目标用户声纹描述,确定所述第一语音会话信息中的所述待进行安全分析的语音交互终端的呼叫安全分析情况。2.根据权利要求1所述的方法,其特征在于,所述第一语音会话信息包括在多种噪声环境下采集的所述待进行安全分析的语音交互终端的片段化音频数据;所述从第一语音会话信息中确定多组第一待处理片段化音频数据,包括:从所述第一语音会话信息中确定出所述多种噪声环境中每种噪声环境对应的至少一组片段化音频数据,得到多组所述第一待处理片段化音频数据。3.根据权利要求1所述的方法,其特征在于,在所述通过所述目标用户声纹描述,确定所述第一语音会话信息中的所述待进行安全分析的语音交互终端的呼叫安全分析情况之前,所述方法还包括:从所述第一语音会话信息中确定至少一组第二待处理片段化音频数据,并分别对每组第二待处理片段化音频数据进行显著文本内容识别,分别确定每组第二待处理片段化音频数据中的待进行安全分析的语音交互终端的第一设定交互事件对应的显著文本内容;从所述显著文本内容中确定设定数目的目标显著文本内容;通过每组第二待处理片段化音频数据和每组第二待处理片段化音频数据对应的目标显著文本内容,确定每组第二待处理片段化音频数据中的待进行安全分析的语音交互终端对应的第一识别可能性;所述通过所述目标用户声纹描述,确定所述第一语音会话信息中的所述待进行安全分析的语音交互终端的呼叫安全分析情况,包括:通过每组第二待处理片段化音频数据对应的第一识别可能性和所述目标用户声纹描述,确定所述第一语音会话信息中的所述待进行安全分析的语音交互终端的呼叫安全分析情况;其中,通过所述目标显著文本内容和所述第二待处理片段化音频数据,确定所述第二待处理片段化音频数据中的待进行安全分析的语音交互终端对应的第一识别可能性,包括:确定所述第一设定交互事件对应的设定词向量;以及通过每个所述目标显著文本内容对应的主题信息的词向量,确定所述第一设定交互事件对应的真实词向量;通过所述设定词向量和所述真实词向量,确定目标映射列表;通过所述目标映射列表,对所述每个所述显著文本内容对应的主题信息进行词向量映射;通过所述第二待处理片段化音频数据和词向量映射后的每个所述显著文本内容,确定所述第二待处理片段化音频数据中的待进行安全分析的语音交互终端的第一识别可能性;其中,所述通过所述第二待处理片段化音频数据和词向量映射后的每个所述显著文本内容,确定所述第二待处理片段化音频数据中的待进行安全分析的语音交互终端的第一识别可能性,包括:通过所述目标映射列表,对所述第二待处理片段化音频数据进行词向量映
射,得到已映射片段化音频数据;通过所述已映射片段化音频数据和词向量映射后的每个所述显著文本内容,从所述已映射片段化音频数据中抽取所述待进行安全分析的语音交互终端的第一设定交互事件对应的目标片段化音频数据;通过所述目标片段化音频数据和所述第二待处理片段化音频数据,确定所述第二待处理片段化音频数据中的待进行安全分析的语音交互终端的第一识别可能性。4.根据权利要求3所述的方法,其特征在于,所述通过所述目标片段化音频数据和所述第二待处理片段化音频数据,确定所述第二待处理片段化音频数据中的待进行安全分析的语音交互终端的第一识别可能性,包括:确定所述目标片段化音频数据的第一注意力描述内容,以及所述第二待处理片段化音频数据的第二注意力描述内容;对所述第一注意力描述内容和第二注意力描述内容进行合并,得到第三注意力描述内容;通过所述第三注意力描述内容,确定所述第二待处理片段化音频数据中的待进行安全分析的语音交互终端的第一识别可能性。5.根据权利要求4所述的方法,其特征在于,所述通过每组第二待处理片段化音频数据对应的第一识别可能性和所述目标用户声纹描述,确定所述第一语音会话信息中的所述待进行安全分析的语音交互终端的呼叫安全分析情况,包括:通过所述目标用户声纹描述,确定所述待进行安全分析的语音交互终端对应的第二识别可能性;通过所述第一识别可能性和所述第二识别可能性,确定所述待进行安全分析的...

【专利技术属性】
技术研发人员:陈晶赵斌
申请(专利权)人:陈晶
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1