一种面向语音转换的主动式取证方法技术

技术编号：37357682 阅读：8 留言：0更新日期：2023-04-27 07:07

本发明专利技术公开了一种面向语音转换的主动式取证方法，涉及人工智能与计算机安全技术领域。包括：构建音频文件集；其中，音频文件集由多个说话人的音频文件组成；将目标说话人音频、音频文件集输入取证模型，在目标说话人音频上添加噪声，并利用原始说话人数据集对添加的噪声进行优化，得到优化完成的取证模型；将目标说话人音频、音频文件集输入优化完成的取证模型，若得到的语音转换声纹损失值小于预设阈值，则完成主动取证。本发明专利技术实现了在说话人的语音数据上添加特定的噪声，可以帮助执法人员及相关部门确定语音转换的原始说话人。员及相关部门确定语音转换的原始说话人。员及相关部门确定语音转换的原始说话人。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向语音转换的主动式取证方法

[0001]本专利技术涉及人工智能与计算机安全
，更具体的说是涉及一种面向语音转换的主动式取证方法。

技术介绍

[0002]当今，随着人工智能的发展，基于机器学习的语音转换技术应用场景越来越广泛，该领域的研究以及应用也进一步扩展。因该技术可以实现说话人的语音转换，语音转换技术在声音模仿，影视配音等各种场景下得到大量应用。
[0003]然而，未经允许的语音转换对语音安全造成了很大的威胁，利用语音转换实现诈骗等行为屡有出现，这使得说话人语音数据的泄露会造成极大的语音安全隐患。
[0004]针对上面的问题，提出一种面向语音转换的主动式取证方法，在说话人的语音数据上添加特定的噪声，可以帮助执法人员及相关部门确定语音转换的原始说话人，实现主动取证。因此，提供一种面向语音转换的主动式取证方法以解决上述问题，是本领域技术人员亟需解决的问题。

技术实现思路

[0005]有鉴于此，本专利技术的目的在于针对现有的不法利用说话人语音数据实施语音转换达成非法目的的问题，提出一种面向语音转换的主动式取证方法，帮助执法人员及相关部门确定语音转换的原始说话人，实现主动取证。
[0006]为了实现上述目的，本专利技术采用如下技术方案：
[0007]一种面向语音转换的主动式取证方法，包括以下步骤：
[0008]S1构建音频文件集；其中，音频文件集由多个说话人的音频文件组成；
[0009]S2将目标说话人音频、音频文件集输入取证模型，在目标说话人音频...

【技术保护点】

【技术特征摘要】
1.一种面向语音转换的主动式取证方法，其特征在于，包括以下步骤：S1构建音频文件集；其中，音频文件集由多个说话人的音频文件组成；S2将目标说话人音频、音频文件集输入取证模型，在目标说话人音频上添加噪声，并利用原始说话人数据集对添加的噪声进行优化，得到优化完成的噪声；S3基于优化完成的噪声对目标说话人、原始说话人的声纹进行相似度值计算，完成主动取证。2.根据权利要求1所述的一种面向语音转换的主动式取证方法，其特征在于，S1具体步骤包括：S1.1搜集原始说话人语音数据集；S1.2将原始说话人语音数据集中的音频数据进行预处理；S1.3将预处理后的音频数据规范化为音频文件集。3.根据权利要求2所述的一种面向语音转换的主动式取证方法，其特征在于，S1.1具体步骤包括：搜集若干开源的说话人语音数据集，构成说话人总人数为n的原始说话人语音数据集，其中n为大于1的整数。4.根据权利要求2所述的一种面向语音转换的主动式取证方法，其特征在于，S1.2具体步骤包括：将原始说话人语音数据集中所有的音频数据通过重采样方法进行预处理。5.根据权利要求2所述的一种面向语音转换的主动式取证方法，其特征在于，S1.3具体步骤包括：将预处理好的音频数据根据预设的文件格式，保存为音频文件；将音频文件根据命名规范进行重命名；将重命名后的音频文件组成为音频文件集。6.根据权利要求1所述的一种面向语音转换的主动式取证方法，其特征在于，S2具体步骤包括：S2.1在待测目标的目标说话人音频上添加噪声，得到目标加噪音频；S2.2通过说话人编码器分别在目标说话人音频、目标加噪音频中提取目标说话人语音特征向量、目标加噪语音特征向量；S2.3将输入到语音转换模块的原始音频和目标音频转换为语音转换音频；其中，...

【专利技术属性】
技术研发人员：陈艳姣，徐文渊，钟奕楠，邓江毅，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人