数据处理方法、装置及设备制造方法及图纸

技术编号：39044510 阅读：10 留言：0更新日期：2023-10-10 11:57

本说明书实施例提供了一种数据处理方法、装置及设备，其中，该方法包括：接收待检测的目标音频数据，通过预先训练的检测模型对目标音频数据进行频谱提取处理，得到与目标音频数据对应的目标频谱数据，并通过预先训练的检测模型对目标频谱数据进行音频合成处理，得到与目标音频数据对应的合成音频数据，通过预先训练的检测模型分别对目标音频数据和合成音频数据进行声纹提取处理，得到与目标音频数据对应的第一声纹特征向量，以及与合成音频数据对应的第二声纹特征向量，基于第一声纹特征向量和第二声纹特征向量之间的相似度，对目标音频数据为合成数据或非合成数据进行判断，得到针对目标音频数据的检测结果。目标音频数据的检测结果。目标音频数据的检测结果。

全部详细技术资料下载

【技术实现步骤摘要】
数据处理方法、装置及设备

[0001]本文件涉及数据处理
，尤其涉及一种数据处理方法、装置及设备。

技术介绍

[0002]随着语音合成和语音转换技术的发展与成熟，合成语音越来越真实，这给说话人识别系统带来了很大的安全隐患。由于合成语音是将人工智能、机器学习、大数据挖掘等新技术应用于恶意窃取等场景，因此，合成语音的科技手段含量较高，更具有欺骗性和迷惑性，人耳很难辨别语音是否为合成语音，因此，需要一种能够提高对音频是否为合成音频进行检测的检测效率和检测准确性的解决方案。

技术实现思路

[0003]本说明书实施例的目的是提供一种数据处理方法、装置及设备，以提供一种能够提高对音频是否为合成音频进行检测的检测效率和检测准确性的解决方案。
[0004]为了实现上述技术方案，本说明书实施例是这样实现的：
[0005]第一方面，本说明书实施例提供了一种数据处理方法，包括：接收待检测的目标音频数据；通过预先训练的检测模型对所述目标音频数据进行频谱提取处理，得到与所述目标音频数据对应的目标频谱数据，并通过所述预先训练的检测模型对所述目标频谱数据进行音频合成处理，得到与所述目标音频数据对应的合成音频数据；通过所述预先训练的检测模型分别对所述目标音频数据和所述合成音频数据进行声纹提取处理，得到与所述目标音频数据对应的第一声纹特征向量，以及与所述合成音频数据对应的第二声纹特征向量；基于所述第一声纹特征向量和所述第二声纹特征向量之间的相似度，对所述目标音频数据为合成数据或非合成数据进行判断，得到针对所述目标...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法，包括：接收待检测的目标音频数据；通过预先训练的检测模型对所述目标音频数据进行频谱提取处理，得到与所述目标音频数据对应的目标频谱数据，并通过所述预先训练的检测模型对所述目标频谱数据进行音频合成处理，得到与所述目标音频数据对应的合成音频数据；通过所述预先训练的检测模型分别对所述目标音频数据和所述合成音频数据进行声纹提取处理，得到与所述目标音频数据对应的第一声纹特征向量，以及与所述合成音频数据对应的第二声纹特征向量；基于所述第一声纹特征向量和所述第二声纹特征向量之间的相似度，对所述目标音频数据为合成数据或非合成数据进行判断，得到针对所述目标音频数据的检测结果。2.根据权利要求1所述的方法，在所述通过预先训练的检测模型对所述目标音频数据进行频谱提取处理，得到与所述目标音频数据对应的目标频谱数据之前，还包括：获取用于训练所述检测模型的历史音频数据；通过所述检测模型对所述历史音频数据进行频谱提取处理，得到与所述历史音频数据对应的第一频谱数据，并通过所述检测模型对所述第一频谱数据进行音频合成处理，得到与所述历史音频数据对应的第一合成数据；通过所述检测模型分别对所述历史音频数据和所述第一合成数据进行声纹提取处理，得到与所述历史音频数据对应的第三声纹特征向量，以及与所述第一合成数据对应的第四声纹特征向量；基于所述第三声纹特征向量和所述第四声纹特征向量之间的第一相似度，对所述检测模型进行迭代训练，直到所述检测模型收敛，得到所述训练后的检测模型。3.根据权利要求2所述的方法，所述基于所述第三声纹特征向量和所述第四声纹特征向量之间的第一相似度，对所述检测模型进行迭代训练，直到所述检测模型收敛，得到所述训练后的检测模型，包括：获取与所述历史音频数据对应的第一音频数据，所述历史音频数据对应的用户与所述第一音频数据对应的用户相同；通过所述检测模型对所述第一音频数据进行声纹提取处理，得到与所述第一音频数据对应的第五声纹特征向量；基于所述第三声纹特征向量与所述第四声纹特征向量之间的第一相似度、所述第三声纹特征向量与所述第五声纹特征向量之间的第二相似度，以及所述第四声纹特征向量与所述第五声纹特征向量之间的第三相似度，对所述检测模型进行迭代训练，直到所述检测模型收敛，得到所述训练后的检测模型。4.根据权利要求3所述的方法，所述基于所述第三声纹特征向量与所述第四声纹特征向量之间的第一相似度、所述第三声纹特征向量与所述第五声纹特征向量之间的第二相似度，以及所述第四声纹特征向量与所述第五声纹特征向量之间的第三相似度，对所述检测模型进行迭代训练，直到所述检测模型收敛，得到所述训练后的检测模型，包括：获取所述第二相似度与所述第一相似度之间的第一差值，以及所述第二相似度与所述第三相似度之间的第二差值；基于所述第一差值和所述第二差值，对所述检测模型进行迭代训练，直到所述检测模
型收敛，得到所述训练后的检测模型。5.根据权利要求4所述的方法，所述基于所述第一声纹特征向量和所述第二声纹特征向量之间的相似度，对所述目标...

【专利技术属性】
技术研发人员：顾艳梅，王志铭，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人