一种语音检测模型训练和语音检测方法技术

技术编号:38528900 阅读:48 留言:0更新日期:2023-08-19 17:03
本申请提供一种语音检测模型的训练方法,包括:采集训练语音检测模型使用的语音,分别提取语音中每一条语音的声纹特征并进行差分得到第一特征信号。将第一特征信号作为神经网络的输入,使用损失函数迭代训练神经网络的参数,直至满足结束条件,得到目标语音检测模型。神经网络用于学习第一特征信号中携带的时序信息。由此,通过建立可以深度学习语音所携带时序信息的目标语音检测模型,可以提高对语音信号的真伪进行检测的准确性和鲁棒性。信号的真伪进行检测的准确性和鲁棒性。信号的真伪进行检测的准确性和鲁棒性。

【技术实现步骤摘要】
一种语音检测模型训练和语音检测方法


[0001]本申请涉及语音数据处理
,尤其涉及一种语音检测模型训练和语音检测方法。

技术介绍

[0002]随着深度学习技术的发展,人工智能生成内容质量不断提升。在语音领域,通过深度生成方法可以针对特定人物生成高质量伪造语音。语音合成在语音助手、人机交互、智能客服等方面带来了巨大便利。
[0003]伪造语音检测技术的主要目标就是自动化鉴别各种语音伪造算法生成的伪造语音。当前主流的伪造语音检测系统一般分为前端特征和后端分类器两部分。前端特征通过对语音信号进行时频分析提取具有区分性的特征,后端通过神经网络分类器判断语音是真实语音还是伪造语音。近年来基于深度学习的系统逐渐成为主流,前端可以通过不同方法提取语音时频特征,如语谱图特征、梅尔谱特征等。后端则可以通过深度神经网络学习特征的高级表示,并进行分类判决。
[0004]但目前基于深度学习的伪造语音检测技术可解释性较差,由于特征不直观,神经网络提取的表达较为抽象,难以发现真伪语音在现实的差异,缺少物理意义。因此,需要一种能提高伪造语音进行检测的准本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音检测模型的训练方法,包括:采集训练语音检测模型使用的语音;所述语音包括至少一条自然语音和至少一条伪造语音,所述自然语音和伪造语音各自携带标签信息;分别提取所述语音中每一条语音的声纹特征并进行差分得到第一特征信号;所述声纹特征是与所述语音中每一条语音的语义无关的特征;将所述语音中每一条语音的第一特征信号和携带的标签信息作为神经网络的输入,使用损失函数迭代训练神经网络的参数,直至满足结束条件,得到目标语音检测模型;所述神经网络用于学习第一特征信号中携带的时序信息。2.根据权利要求1所述的方法,其特征在于,所述结束条件为迭代前后计算得到的损失函数的差值小于预设阈值,或迭代次数达到预设次数;所述目标语音检测模型,是满足结束条件时的参数对应的神经网络所组成的模型。3.根据权利要求1所述的方法,其特征在于,所述目标语音检查模型还包括声纹识别模块,所述声纹识别模块用于提取所述语音中每一条语音的声纹特征并进行差分得到第一特征信号。4.根据权利要求3所述的方法,其特征在于,所述声纹识别模块包括分类层和卷积层;所述提取所述语音中每一条语音的声纹特征并进行差分得到第一特征信号,包括:利用所述卷积层提取所述语音中每一条语音的浅层声纹特征;将所述浅层声纹特征进行差分得到第一特征信号;所述浅层是所述分类层中初始的层级。5.根据权利要求1所述的方法,其特征在于,所述神经网络包括循环神经网络和线性分类层。6.根据权利要求1所述的方法,所述损失...

【专利技术属性】
技术研发人员:王文超张宇翔周军张鹏远陈树丽
申请(专利权)人:中国科学院声学研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1