【技术实现步骤摘要】
一种基于人工智能的语音呼叫处理方法及系统
[0001]本申请涉及语音处理
,特别涉及一种基于人工智能的语音呼叫处理方法及系统。
技术介绍
[0002]随着移动互联网的快速发展,通过语音进行交互的方式越来越频繁,这样可以在一定程度上丰富人们的生活,但同时也存在着一些风险。比如:通过手机、平板电话等终端所生成的语音信息可能是通过机器合成的。这样的语音信息可能会存在电话诈骗、传播造假信息等。因此,为了避免出现上述问题,需要对手机、平板电话等终端所生成的语音信息进行安全分析。然而专利技术人经研究发现,相关语音信息分析方案还存在一些待改进的地方,比如针对机器合成的安全分析技术而言,现目前难以保障其精度和可信度。
技术实现思路
[0003]为改善相关技术中存在的技术问题,本申请提供了一种基于人工智能的语音呼叫处理方法及系统。
[0004]第一方面,本申请实施例提供了一种基于人工智能的语音呼叫处理方法,应用于基于人工智能的语音呼叫处理云平台,所述方法至少包括:确定待进行安全分析的语音交互终端对应的第一语音会话信息;从第一语音会话信息中确定多组第一待处理片段化音频数据,并确定每组第一待处理片段化音频数据的原始用户声纹描述;所述原始用户声纹描述包括所述第一待处理片段化音频数据在呼叫场景层面下的用户声纹描述;依据所述多组第一待处理片段化音频数据在所述第一语音会话信息中的片段化音频数据分布,将每组第一待处理片段化音频数据的原始用户声纹描述进行整理,得到目标用户声纹描述;通过所述目标用户声纹描述,确定所述第一语 ...
【技术保护点】
【技术特征摘要】
1.一种基于人工智能的语音呼叫处理方法,其特征在于,应用于基于人工智能的语音呼叫处理云平台,所述方法至少包括:确定待进行安全分析的语音交互终端对应的第一语音会话信息;从第一语音会话信息中确定多组第一待处理片段化音频数据,并确定每组第一待处理片段化音频数据的原始用户声纹描述;其中,所述原始用户声纹描述包括所述第一待处理片段化音频数据在呼叫场景层面下的用户声纹描述;依据所述多组第一待处理片段化音频数据在所述第一语音会话信息中的片段化音频数据分布,将每组第一待处理片段化音频数据的原始用户声纹描述进行整理,得到目标用户声纹描述;通过所述目标用户声纹描述,确定所述第一语音会话信息中的所述待进行安全分析的语音交互终端的呼叫安全分析情况。2.根据权利要求1所述的方法,其特征在于,所述第一语音会话信息包括在多种噪声环境下采集的所述待进行安全分析的语音交互终端的片段化音频数据;所述从第一语音会话信息中确定多组第一待处理片段化音频数据,包括:从所述第一语音会话信息中确定出所述多种噪声环境中每种噪声环境对应的至少一组片段化音频数据,得到多组所述第一待处理片段化音频数据。3.根据权利要求1所述的方法,其特征在于,在所述通过所述目标用户声纹描述,确定所述第一语音会话信息中的所述待进行安全分析的语音交互终端的呼叫安全分析情况之前,所述方法还包括:从所述第一语音会话信息中确定至少一组第二待处理片段化音频数据,并分别对每组第二待处理片段化音频数据进行显著文本内容识别,分别确定每组第二待处理片段化音频数据中的待进行安全分析的语音交互终端的第一设定交互事件对应的显著文本内容;从所述显著文本内容中确定设定数目的目标显著文本内容;通过每组第二待处理片段化音频数据和每组第二待处理片段化音频数据对应的目标显著文本内容,确定每组第二待处理片段化音频数据中的待进行安全分析的语音交互终端对应的第一识别可能性;所述通过所述目标用户声纹描述,确定所述第一语音会话信息中的所述待进行安全分析的语音交互终端的呼叫安全分析情况,包括:通过每组第二待处理片段化音频数据对应的第一识别可能性和所述目标用户声纹描述,确定所述第一语音会话信息中的所述待进行安全分析的语音交互终端的呼叫安全分析情况;其中,通过所述目标显著文本内容和所述第二待处理片段化音频数据,确定所述第二待处理片段化音频数据中的待进行安全分析的语音交互终端对应的第一识别可能性,包括:确定所述第一设定交互事件对应的设定词向量;以及通过每个所述目标显著文本内容对应的主题信息的词向量,确定所述第一设定交互事件对应的真实词向量;通过所述设定词向量和所述真实词向量,确定目标映射列表;通过所述目标映射列表,对所述每个所述显著文本内容对应的主题信息进行词向量映射;通过所述第二待处理片段化音频数据和词向量映射后的每个所述显著文本内容,确定所述第二待处理片段化音频数据中的待进行安全分析的语音交互终端的第一识别可能性;其中,所述通过所述第二待处理片段化音频数据和词向量映射后的每个所述显著文本内容,确定所述第二待处理片段化音频数据中的待进行安全分析的语音交互终端的第一识别可能性,包括:通过所述目标映射列表,对所述第二待处理片段化音频数据进行词向量映
射,得到已映射片段化音频数据;通过所述已映射片段化音频数据和词向量映射后的每个所述显著文本内容,从所述已映射片段化音频数据中抽取所述待进行安全分析的语音交互终端的第一设定交互事件对应的目标片段化音频数据;通过所述目标片段化音频数据和所述第二待处理片段化音频数据,确定所述第二待处理片段化音频数据中的待进行安全分析的语音交互终端的第一识别可能性。4.根据权利要求3所述的方法,其特征在于,所述通过所述目标片段化音频数据和所述第二待处理片段化音频数据,确定所述第二待处理片段化音频数据中的待进行安全分析的语音交互终端的第一识别可能性,包括:确定所述目标片段化音频数据的第一注意力描述内容,以及所述第二待处理片段化音频数据的第二注意力描述内容;对所述第一注意力描述内容和第二注意力描述内容进行合并,得到第三注意力描述内容;通过所述第三注意力描述内容,确定所述第二待处理片段化音频数据中的待进行安全分析的语音交互终端的第一识别可能性。5.根据权利要求4所述的方法,其特征在于,所述通过每组第二待处理片段化音频数据对应的第一识别可能性和所述目标用户声纹描述,确定所述第一语音会话信息中的所述待进行安全分析的语音交互终端的呼叫安全分析情况,包括:通过所述目标用户声纹描述,确定所述待进行安全分析的语音交互终端对应的第二识别可能性;通过所述第一识别可能性和所述第二识别可能性,确定所述待进行安全分析的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。