基于语音转换的声纹重构模型构建方法、装置和存储介质制造方法及图纸

技术编号：36932824 阅读：11 留言：0更新日期：2023-03-22 18:55

本说明书实施例提供了一种基于语音转换的声纹重构模型构建方法、装置和存储介质，所述方法包括：基于语音转换构建第一训练集和第二训练集，所述第一训练集用于指示伪装者的原声，所述第二训练集用于指示伪装者通过语音转化得到的声音；根据所述第一训练集，构建第一语音向量；根据所述第二训练集，构建第二语音向量；根据所述第一语音向量和所述第二语音向量，通过向量分解法，确定伪装者原声的特征向量。本申请提供的技术方案用以解决现有技术不能识别伪装者原声的问题。能识别伪装者原声的问题。能识别伪装者原声的问题。

全部详细技术资料下载

【技术实现步骤摘要】
基于语音转换的声纹重构模型构建方法、装置和存储介质

[0001]本文件涉及人工智能与计算机安全领域，尤其涉及一种基于语音转换的声纹重构模型构建方法、装置和存储介质。

技术介绍

[0002]有部分用户利用语音转换技术，通过模仿他人的声音伪装成相应的身份，这会给个人安全带来隐患。
[0003]现有的语音转换检测技术通常基于人工智能，辨认一段音频是真实采样的还是虚假生成的。
[0004]然而，上述方案并不能识别伪装者的原声，因此很难识别伪装者的身份信息。对于个人安全而言，上述方法只能治标，不能治本，无法彻底消除存在的安全隐患。

技术实现思路

[0005]鉴于上述的分析，本申请旨在提出了一种基于语音转换的声纹重构模型构建方法、装置和存储介质，能够识别模仿声音的伪装者的原声，以便于识别伪装者的身份信息。
[0006]第一方面，本说明书一个或多个实施例提供了一种基于语音转换的声纹重构模型构建方法，包括：基于语音转换构建第一训练集和第二训练集，所述第一训练集用于指示伪装者的原声，所述第二训练集用于指示伪装者通过语音转化得到的声音；根据所述第一训练集，构建第一语音向量；根据所述第二训练集，构建第二语音向量；根据所述第一语音向量和所述第二语音向量，通过向量分解法，确定伪装者原声的特征向量。
[0007]进一步地，所述基于语音转换构建第一训练集和第二训练集，包括：采集多个原声数据和多个语音转换模型；利用所述多个原声数据构建所述第一训练集；利用任一所述语音转换模型将任一所述原声数据对应的声纹...

【技术保护点】

【技术特征摘要】
1.一种基于语音转换的声纹重构模型构建方法，其特征在于，包括：基于语音转换构建第一训练集和第二训练集，所述第一训练集用于指示伪装者的原声，所述第二训练集用于指示伪装者通过语音转化得到的声音；根据所述第一训练集，构建第一语音向量；根据所述第二训练集，构建第二语音向量；根据所述第一语音向量和所述第二语音向量，通过向量分解法，确定伪装者原声的特征向量。2.根据权利要求1所述的方法，其特征在于，所述基于语音转换构建第一训练集和第二训练集，包括：采集多个原声数据和多个语音转换模型；利用所述多个原声数据构建所述第一训练集；利用任一所述语音转换模型将任一所述原声数据对应的声纹转换成另一个所述原声语音数据对应的声纹，得到所述第二训练集的一个训练样本。3.根据权利要求1所述的方法，其特征在于，根据所述第一训练集，构建第一语音向量，包括：确定所述第一训练集中的各训练样本对应的语音向量；确定各所述训练样本对应的语音向量的平均向量为所述第一语音向量。4.根据权利要求1所述的方法，其特征在于，根据所述第二训练集，构建第二语音向量，包括：确定所述第二训练集中的各训练样本对应的语音向量；确定各所述训练样本对应的语音向量的平均向量为所述第二语音向量。5.根据权利要求1所述的方法，其特征在于，所述根据所述第一语音向量和所述第二语音向量，通过向量分解法，确定伪装者原声的特征向量，包括：以所述第二语音向量的方向为坐标轴，创建坐标系；在所述坐标系下，分解所述第一语音向量为正交分量和平行分量；根据所述平行分量和所述第一语音向量，确定所述伪装者原...

【专利技术属性】
技术研发人员：陈艳姣，徐文渊，邓江毅，苗钱浩，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人