数据处理方法、装置及设备制造方法及图纸

技术编号:39044510 阅读:10 留言:0更新日期:2023-10-10 11:57
本说明书实施例提供了一种数据处理方法、装置及设备,其中,该方法包括:接收待检测的目标音频数据,通过预先训练的检测模型对目标音频数据进行频谱提取处理,得到与目标音频数据对应的目标频谱数据,并通过预先训练的检测模型对目标频谱数据进行音频合成处理,得到与目标音频数据对应的合成音频数据,通过预先训练的检测模型分别对目标音频数据和合成音频数据进行声纹提取处理,得到与目标音频数据对应的第一声纹特征向量,以及与合成音频数据对应的第二声纹特征向量,基于第一声纹特征向量和第二声纹特征向量之间的相似度,对目标音频数据为合成数据或非合成数据进行判断,得到针对目标音频数据的检测结果。目标音频数据的检测结果。目标音频数据的检测结果。

【技术实现步骤摘要】
数据处理方法、装置及设备


[0001]本文件涉及数据处理
,尤其涉及一种数据处理方法、装置及设备。

技术介绍

[0002]随着语音合成和语音转换技术的发展与成熟,合成语音越来越真实,这给说话人识别系统带来了很大的安全隐患。由于合成语音是将人工智能、机器学习、大数据挖掘等新技术应用于恶意窃取等场景,因此,合成语音的科技手段含量较高,更具有欺骗性和迷惑性,人耳很难辨别语音是否为合成语音,因此,需要一种能够提高对音频是否为合成音频进行检测的检测效率和检测准确性的解决方案。

技术实现思路

[0003]本说明书实施例的目的是提供一种数据处理方法、装置及设备,以提供一种能够提高对音频是否为合成音频进行检测的检测效率和检测准确性的解决方案。
[0004]为了实现上述技术方案,本说明书实施例是这样实现的:
[0005]第一方面,本说明书实施例提供了一种数据处理方法,包括:接收待检测的目标音频数据;通过预先训练的检测模型对所述目标音频数据进行频谱提取处理,得到与所述目标音频数据对应的目标频谱数据,并通过所述预先训练的检测模型对所述目标频谱数据进行音频合成处理,得到与所述目标音频数据对应的合成音频数据;通过所述预先训练的检测模型分别对所述目标音频数据和所述合成音频数据进行声纹提取处理,得到与所述目标音频数据对应的第一声纹特征向量,以及与所述合成音频数据对应的第二声纹特征向量;基于所述第一声纹特征向量和所述第二声纹特征向量之间的相似度,对所述目标音频数据为合成数据或非合成数据进行判断,得到针对所述目标音频数据的检测结果。
[0006]第二方面,本说明书实施例提供了一种数据处理装置,所述装置包括:数据接收模块,用于接收待检测的目标音频数据;第一处理模块,用于通过预先训练的检测模型对所述目标音频数据进行频谱提取处理,得到与所述目标音频数据对应的目标频谱数据,并通过所述预先训练的检测模型对所述目标频谱数据进行音频合成处理,得到与所述目标音频数据对应的合成音频数据;第二处理模块,用于通过所述预先训练的检测模型分别对所述目标音频数据和所述合成音频数据进行声纹提取处理,得到与所述目标音频数据对应的第一声纹特征向量,以及与所述合成音频数据对应的第二声纹特征向量;数据检测模块,用于基于所述第一声纹特征向量和所述第二声纹特征向量之间的相似度,对所述目标音频数据为合成数据或非合成数据进行判断,得到针对所述目标音频数据的检测结果。
[0007]第三方面,本说明书实施例提供了一种数据处理设备,所述数据处理设备包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:接收待检测的目标音频数据;通过预先训练的检测模型对所述目标音频数据进行频谱提取处理,得到与所述目标音频数据对应的目标频谱数据,并通过所述预先训练的检测模型对所述目标频谱数据进行音频合成处理,得到与所述目标音频数据对应的合成音频
数据;通过所述预先训练的检测模型分别对所述目标音频数据和所述合成音频数据进行声纹提取处理,得到与所述目标音频数据对应的第一声纹特征向量,以及与所述合成音频数据对应的第二声纹特征向量;基于所述第一声纹特征向量和所述第二声纹特征向量之间的相似度,对所述目标音频数据为合成数据或非合成数据进行判断,得到针对所述目标音频数据的检测结果。
[0008]第四方面,本说明书实施例提供一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:接收待检测的目标音频数据;通过预先训练的检测模型对所述目标音频数据进行频谱提取处理,得到与所述目标音频数据对应的目标频谱数据,并通过所述预先训练的检测模型对所述目标频谱数据进行音频合成处理,得到与所述目标音频数据对应的合成音频数据;通过所述预先训练的检测模型分别对所述目标音频数据和所述合成音频数据进行声纹提取处理,得到与所述目标音频数据对应的第一声纹特征向量,以及与所述合成音频数据对应的第二声纹特征向量;基于所述第一声纹特征向量和所述第二声纹特征向量之间的相似度,对所述目标音频数据为合成数据或非合成数据进行判断,得到针对所述目标音频数据的检测结果。
附图说明
[0009]为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0010]图1为本说明书一种数据处理系统的示意图;
[0011]图2A为本说明书一种数据处理方法实施例的流程图;
[0012]图2B为本说明书一种数据处理方法的处理过程示意图;
[0013]图3为本说明书一种数据处理过程的示意图;
[0014]图4为本说明书又一种数据处理方法的处理过程示意图;
[0015]图5为本说明书又一种数据处理过程的示意图;
[0016]图6为本说明书一种数据处理装置实施例的结构示意图;
[0017]图7为本说明书一种数据处理设备的结构示意图。
具体实施方式
[0018]本说明书实施例提供一种数据处理方法、装置及设备。
[0019]为了使本
的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
[0020]本说明书实施例提供一种数据处理方法、装置及设备。
[0021]为了使本
的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述
的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
[0022]本说明书的技术方案,可以应用于数据处理系统中,如图1所示,该数据处理系统中可以有终端设备和服务器,其中,服务器可以是独立的服务器,也可以是由多个服务器组成的服务器集群,终端设备可以如个人计算机等设备,也可以如手机、平板电脑等移动终端设备。
[0023]其中,数据处理系统中可以包括n个终端设备和m个服务器,n和m为大于等于1的正整数,终端设备可以用于采集音频数据样本,例如,终端设备可以针对不同的合成音频检测场景,获取对应的音频数据样本,如,针对问答系统的合成音频检测场景,终端设备可以采集用户针对话术的音频反馈信息作为音频数据样本,针对身份认证的合成音频检测场景,终端设备可以采集与身份认证对应的音频数据(如用户输入的用于进行身份认证的音频数据)作为音频数据样本等。
[0024]终端设备可以将本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,包括:接收待检测的目标音频数据;通过预先训练的检测模型对所述目标音频数据进行频谱提取处理,得到与所述目标音频数据对应的目标频谱数据,并通过所述预先训练的检测模型对所述目标频谱数据进行音频合成处理,得到与所述目标音频数据对应的合成音频数据;通过所述预先训练的检测模型分别对所述目标音频数据和所述合成音频数据进行声纹提取处理,得到与所述目标音频数据对应的第一声纹特征向量,以及与所述合成音频数据对应的第二声纹特征向量;基于所述第一声纹特征向量和所述第二声纹特征向量之间的相似度,对所述目标音频数据为合成数据或非合成数据进行判断,得到针对所述目标音频数据的检测结果。2.根据权利要求1所述的方法,在所述通过预先训练的检测模型对所述目标音频数据进行频谱提取处理,得到与所述目标音频数据对应的目标频谱数据之前,还包括:获取用于训练所述检测模型的历史音频数据;通过所述检测模型对所述历史音频数据进行频谱提取处理,得到与所述历史音频数据对应的第一频谱数据,并通过所述检测模型对所述第一频谱数据进行音频合成处理,得到与所述历史音频数据对应的第一合成数据;通过所述检测模型分别对所述历史音频数据和所述第一合成数据进行声纹提取处理,得到与所述历史音频数据对应的第三声纹特征向量,以及与所述第一合成数据对应的第四声纹特征向量;基于所述第三声纹特征向量和所述第四声纹特征向量之间的第一相似度,对所述检测模型进行迭代训练,直到所述检测模型收敛,得到所述训练后的检测模型。3.根据权利要求2所述的方法,所述基于所述第三声纹特征向量和所述第四声纹特征向量之间的第一相似度,对所述检测模型进行迭代训练,直到所述检测模型收敛,得到所述训练后的检测模型,包括:获取与所述历史音频数据对应的第一音频数据,所述历史音频数据对应的用户与所述第一音频数据对应的用户相同;通过所述检测模型对所述第一音频数据进行声纹提取处理,得到与所述第一音频数据对应的第五声纹特征向量;基于所述第三声纹特征向量与所述第四声纹特征向量之间的第一相似度、所述第三声纹特征向量与所述第五声纹特征向量之间的第二相似度,以及所述第四声纹特征向量与所述第五声纹特征向量之间的第三相似度,对所述检测模型进行迭代训练,直到所述检测模型收敛,得到所述训练后的检测模型。4.根据权利要求3所述的方法,所述基于所述第三声纹特征向量与所述第四声纹特征向量之间的第一相似度、所述第三声纹特征向量与所述第五声纹特征向量之间的第二相似度,以及所述第四声纹特征向量与所述第五声纹特征向量之间的第三相似度,对所述检测模型进行迭代训练,直到所述检测模型收敛,得到所述训练后的检测模型,包括:获取所述第二相似度与所述第一相似度之间的第一差值,以及所述第二相似度与所述第三相似度之间的第二差值;基于所述第一差值和所述第二差值,对所述检测模型进行迭代训练,直到所述检测模
型收敛,得到所述训练后的检测模型。5.根据权利要求4所述的方法,所述基于所述第一声纹特征向量和所述第二声纹特征向量之间的相似度,对所述目标...

【专利技术属性】
技术研发人员:顾艳梅王志铭
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1