当前位置: 首页 > 专利查询>浙江大学专利>正文

一种面向语音转换的主动式取证方法技术

技术编号:37357682 阅读:8 留言:0更新日期:2023-04-27 07:07
本发明专利技术公开了一种面向语音转换的主动式取证方法,涉及人工智能与计算机安全技术领域。包括:构建音频文件集;其中,音频文件集由多个说话人的音频文件组成;将目标说话人音频、音频文件集输入取证模型,在目标说话人音频上添加噪声,并利用原始说话人数据集对添加的噪声进行优化,得到优化完成的取证模型;将目标说话人音频、音频文件集输入优化完成的取证模型,若得到的语音转换声纹损失值小于预设阈值,则完成主动取证。本发明专利技术实现了在说话人的语音数据上添加特定的噪声,可以帮助执法人员及相关部门确定语音转换的原始说话人。员及相关部门确定语音转换的原始说话人。员及相关部门确定语音转换的原始说话人。

【技术实现步骤摘要】
一种面向语音转换的主动式取证方法


[0001]本专利技术涉及人工智能与计算机安全
,更具体的说是涉及一种面向语音转换的主动式取证方法。

技术介绍

[0002]当今,随着人工智能的发展,基于机器学习的语音转换技术应用场景越来越广泛,该领域的研究以及应用也进一步扩展。因该技术可以实现说话人的语音转换,语音转换技术在声音模仿,影视配音等各种场景下得到大量应用。
[0003]然而,未经允许的语音转换对语音安全造成了很大的威胁,利用语音转换实现诈骗等行为屡有出现,这使得说话人语音数据的泄露会造成极大的语音安全隐患。
[0004]针对上面的问题,提出一种面向语音转换的主动式取证方法,在说话人的语音数据上添加特定的噪声,可以帮助执法人员及相关部门确定语音转换的原始说话人,实现主动取证。因此,提供一种面向语音转换的主动式取证方法以解决上述问题,是本领域技术人员亟需解决的问题。

技术实现思路

[0005]有鉴于此,本专利技术的目的在于针对现有的不法利用说话人语音数据实施语音转换达成非法目的的问题,提出一种面向语音转换的主动式取证方法,帮助执法人员及相关部门确定语音转换的原始说话人,实现主动取证。
[0006]为了实现上述目的,本专利技术采用如下技术方案:
[0007]一种面向语音转换的主动式取证方法,包括以下步骤:
[0008]S1构建音频文件集;其中,音频文件集由多个说话人的音频文件组成;
[0009]S2将目标说话人音频、音频文件集输入取证模型,在目标说话人音频上添加噪声,并利用原始说话人数据集对添加的噪声进行优化,得到优化完成的噪声;
[0010]S3基于优化完成的噪声对目标说话人、原始说话人的声纹进行相似度值计算,完成主动取证。
[0011]可选的,S1具体步骤包括:
[0012]S1.1搜集原始说话人语音数据集;
[0013]S1.2将原始说话人语音数据集中的音频数据进行预处理;
[0014]S1.3将预处理后的音频数据规范化为音频文件集。
[0015]可选的,S1.1具体步骤包括:
[0016]搜集若干开源的说话人语音数据集,构成说话人总人数为n的原始说话人语音数据集,其中n为大于1的整数。
[0017]可选的,S1.2具体步骤包括:
[0018]将原始说话人语音数据集中所有的音频数据通过重采样方法进行预处理。
[0019]可选的,S1.3具体步骤包括:
[0020]将预处理好的音频数据根据预设的文件格式,保存为音频文件;
[0021]将音频文件根据命名规范进行重命名;
[0022]将重命名后的音频文件组成为音频文件集。
[0023]可选的,S2具体步骤包括:
[0024]S2.1在待测目标的目标说话人音频上添加噪声,得到目标加噪音频;
[0025]S2.2通过说话人编码器分别在目标说话人音频、目标加噪音频中提取目标说话人语音特征向量、目标加噪语音特征向量;
[0026]S2.3将输入到语音转换模块的原始音频和目标音频转换为语音转换音频;其中,语音转换模块的原始音频为多个说话人中任一个说话人的音频文件,语音转换模块的目标音频为目标加噪音频;
[0027]S2.4通过声纹提取器分别在原始音频、语音转换音频中提取第一声纹向量、第二声纹向量;
[0028]S2.5语音特征损失:通过目标说话人语音特征向量、目标加噪语音特征向量计算得到添加噪声后的语音特征损失值;
[0029]S2.6通过第一声纹向量、第二声纹向量计算得到语音转换声纹损失值;
[0030]S2.7通过语音特征损失值、语音转换声纹损失值计算总损失值;
[0031]S2.8迭代收敛:根据总损失值计算梯度,利用特定的优化模型回传更新添加的噪声,反复迭代直至损失值收敛到预设阈值,完成噪声优化。
[0032]可选的,S2.1具体步骤包括:
[0033]在目标说话人音频上根据噪声添加公式添加噪声,得到目标加噪音频。
[0034]可选的,S2.2具体步骤包括:
[0035]通过说话人编码器中的第一语音特征计算公式在目标说话人音频中提取目标说话人语音特征向量;
[0036]通过说话人编码器中的第二语音特征计算公式在目标加噪音频中提取目标加噪语音特征向量。
[0037]可选的,S2.3具体步骤包括:
[0038]取多个说话人中任一个说话人的音频文件作为语音转换模块的原始音频;
[0039]将目标加噪音频作为语音转换模块的目标音频;
[0040]将语音转换模块的原始音频和目标音频通过语音转换公式计算得到语音转换音频。
[0041]可选的,S2.4具体步骤包括:
[0042]通过声纹提取器中的第一声纹计算公式在原始音频中提取第一声纹向量,通过声纹提取器中的第二声纹计算公式在语音转换音频中提取第二声纹向量。
[0043]经由上述的技术方案可知,与现有技术相比,本专利技术公开提供了一种面向语音转换的主动式取证方法,从而可以得到以下有益效果:
[0044]1)可以实现对语音转换音频的主动取证;
[0045]2)可以从数据处理层面解决恶意使用语音转换带来的安全问题;
[0046]3)通过对添加噪音的优化,适用于对待测目标使用的各种语音转换方法进行破解;
[0047]4)可以在实现主动取证目的的同时保证目标说话人语音的质量。
附图说明
[0048]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0049]图1为本专利技术一种面向语音转换的主动式取证方法的流程图。
[0050]图2为本专利技术一具体实施例的方法流程图。
具体实施方式
[0051]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0052]如图1所示,本专利技术实施例公开了一种面向语音转换的主动式取证方法,包括以下步骤:
[0053]S1构建音频文件集;其中,音频文件集由多个说话人的音频文件组成;
[0054]S2将目标说话人音频、音频文件集输入取证模型,在目标说话人音频上添加噪声,并利用原始说话人数据集对添加的噪声进行优化,得到优化完成的噪声;
[0055]S3基于优化完成的噪声对目标说话人、原始说话人的声纹进行相似度值计算,完成主动取证。
[0056]更进一步的,通过S2使得合成的音频与添加噪声前的音频具有相似的声音特征本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向语音转换的主动式取证方法,其特征在于,包括以下步骤:S1构建音频文件集;其中,音频文件集由多个说话人的音频文件组成;S2将目标说话人音频、音频文件集输入取证模型,在目标说话人音频上添加噪声,并利用原始说话人数据集对添加的噪声进行优化,得到优化完成的噪声;S3基于优化完成的噪声对目标说话人、原始说话人的声纹进行相似度值计算,完成主动取证。2.根据权利要求1所述的一种面向语音转换的主动式取证方法,其特征在于,S1具体步骤包括:S1.1搜集原始说话人语音数据集;S1.2将原始说话人语音数据集中的音频数据进行预处理;S1.3将预处理后的音频数据规范化为音频文件集。3.根据权利要求2所述的一种面向语音转换的主动式取证方法,其特征在于,S1.1具体步骤包括:搜集若干开源的说话人语音数据集,构成说话人总人数为n的原始说话人语音数据集,其中n为大于1的整数。4.根据权利要求2所述的一种面向语音转换的主动式取证方法,其特征在于,S1.2具体步骤包括:将原始说话人语音数据集中所有的音频数据通过重采样方法进行预处理。5.根据权利要求2所述的一种面向语音转换的主动式取证方法,其特征在于,S1.3具体步骤包括:将预处理好的音频数据根据预设的文件格式,保存为音频文件;将音频文件根据命名规范进行重命名;将重命名后的音频文件组成为音频文件集。6.根据权利要求1所述的一种面向语音转换的主动式取证方法,其特征在于,S2具体步骤包括:S2.1在待测目标的目标说话人音频上添加噪声,得到目标加噪音频;S2.2通过说话人编码器分别在目标说话人音频、目标加噪音频中提取目标说话人语音特征向量、目标加噪语音特征向量;S2.3将输入到语音转换模块的原始音频和目标音频转换为语音转换音频;其中,...

【专利技术属性】
技术研发人员:陈艳姣徐文渊钟奕楠邓江毅
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1