一种鲁棒的伪造语音算法的溯源方法及装置制造方法及图纸

技术编号：39242117 阅读：33 留言：0更新日期：2023-10-30 11:54

本发明专利技术提供一种鲁棒的伪造语音算法的溯源方法及装置。该方法包括：利用训练数据集训练针对伪造语音算法的分类器；利用训练好的分类器处理所述训练数据集，得到所述分类器中的隐层针对所述各条伪造语音生成的隐层特征；利用训练好的分类器处理待检测的目标语音信号，得到所述分类器中的隐层生成的目标隐层特征和所述分类器的输出层输出的目标分类结果；分别计算所述目标隐层特征与若干隐层特征的距离，并确定其中的最短距离；当所述最短距离大于或等于预设阈值时，将所述目标分类结果作为所述目标语音信号的最终分类结果。如此，可以使用声码器生成伪造算法识别的训练集。引入最邻近节点算法，通过最邻近距离的分布区分训练集中不存在的分布外数据。集中不存在的分布外数据。集中不存在的分布外数据。

全部详细技术资料下载

【技术实现步骤摘要】
一种鲁棒的伪造语音算法的溯源方法及装置

[0001]本说明书一个或多个实施例涉及语音处理
，尤其涉及一种鲁棒的伪造语音算法的溯源方法及装置。

技术介绍

[0002]随着技术的不断进步，语音技术得到了广泛的应用，例如语音识别、语音合成等。伴随着深度学习的蓬勃发展，在语音领域的许多任务引入了人工智能技术以提升性能。然而，语音技术在发展的过程中，也引入了一些挑战。其中一个重要的挑战是语音欺骗攻击，即使用语音合成、语音转换、拼接等技术制作虚假的语音片段，以达成欺骗自动说话人识别系统、或欺骗人们散播谣言等目的。
[0003]为了应对语音欺骗攻击的重大威胁，近年来针对语音欺骗攻击的伪造语音检测系统的发展备受关注。然而虽然许多伪造语音检测方法被提出，但是只有极少数被实施。现有的伪造语音检测系统无法分辨制造伪造语音的算法。同时，由于深度神经网络过度自信的问题，当前的伪造语音检测算法无法对训练集中未出现过的分布外的数据进行剔除，而是会高置信度将其分为已知类别，难以得到人们的信赖。

技术实现思路

[0004]本专利...

【技术保护点】

【技术特征摘要】
1.一种鲁棒的伪造语音算法的溯源方法，其特征在于，所述方法包括：获取训练数据集，其中包括多条伪造语音以及各条伪造语音的伪造算法类别标签；利用所述训练数据集训练针对伪造语音算法的分类器；利用训练好的分类器处理所述训练数据集，得到所述分类器中的隐层针对所述各条伪造语音生成的隐层特征，归入隐层特征集；利用训练好的分类器处理待检测的目标语音信号，得到所述分类器中的隐层生成的目标隐层特征和所述分类器的输出层输出的目标分类结果；分别计算所述目标隐层特征与若干隐层特征的距离，并确定出其中的最短距离；所述若干隐层特征属于所述隐层特征集，且对应的伪造算法类别标签与所述目标分类结果一致；当所述最短距离大于或等于预设阈值时，将所述目标分类结果作为所述目标语音信号的最终分类结果。2.根据权利要求1所述的方法，其中，所述获取训练数据集，包括：获取真实语音的梅尔谱特征；将所述梅尔谱特征输入多个不同的声码器，对应得到多条伪造语音，为其中各条伪造语音添加指示其所对应声码器类型的伪造算法类别标签后，归入所述训练数据集。3.根据权利要求2所述的方法，其特征在于，所述获取真实语音的梅尔谱特征，包括：获取真实语音，针对获取的所述真实语音进行预处理，其中所述预处理包括对所述真实语音进行预加重、分帧和加窗；基于所述预处理后的所述真实语音，进行短时傅里叶变换，确定对应于所述真实语音的时频特征；基于所述真实语音的时频特征，利用梅尔滤波器组进行滤波，确定所述真实语音的梅尔谱特征。4.根据权利要求2所述的方法，其特征在于，所述多个不同的声码器基于深度神经网络实现。5.根据权利要求1所述的方法，其特征在于，所述目标隐层特征与若干隐层特征的距离采用最邻近节点算法实现。6.根据权利要求1所述的方法，其特征在于，所述利用训练好的分类器处理所述训练数据集之前还包括：使用自监督预训练语音特征...

【专利技术属性】
技术研发人员：王文超，陆镜泽，张鹏远，陈树丽，
申请(专利权)人：中国科学院声学研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人