一种语音检测方法技术

技术编号:38897657 阅读:13 留言:0更新日期:2023-09-22 14:18
本申请提供了一种语音检测方法,包括:获取目标语音,将所述目标语音进行预处理,所述预处理包括预加重、分帧及加窗;确定所述预处理后目标语音的第一声道特征、第一声源波特征和多种第一相关特征;基于所述第一声道特征、第一声源波特征和多种第一相关特征确定所述第一主成分特征;将所述第一主成分特征输入训练好的分类器,输出分类的结果,所述分类结果为伪造语音,或自然语音。本申请利用伪造语音在基频处留下的痕迹信息,利用伪造语音与自然语音在声源和声道特征上的差异以实现伪造语音检测。使用主成分分析的方法分别对声源和声道特征进行筛选,选取具有较高相关性的主成分作为特征,减少特征维度和冗余特征,提高模型的泛化能力和效率。的泛化能力和效率。的泛化能力和效率。

【技术实现步骤摘要】
一种语音检测方法


[0001]本申请涉及语音检测领域,尤其涉及一种语音检测方法。

技术介绍

[0002]随着技术的不断进步,语音技术得到了广泛的应用,例如语音识别、语音合成等。伴随着深度学习的蓬勃发展,在语音领域的许多任务中引入了人工智能技术以提升性能。然而,语音技术在发展的过程中,也引入了一些挑战。为了应对语音欺骗攻击的重大威胁,近年来针对语音欺骗攻击的伪造语音检测系统的发展备受关注。虽然许多伪造语音检测方法被提出,但是只有极少数被实施。现有的伪造语音检测系统没有针对伪造语音的特点进行设计,导致模型泛化能力低,难以得到人们的信赖。
[0003]当前伪造语音检测系统鉴伪系统过度依赖传统的人工设计特征和深度神经网络的分类性能,没有针对伪造语音特点进行设计,导致模型与数据集密切相关,在实际应用场景中泛化性较差,难以实际部署。

技术实现思路

[0004]第一方面,本申请实施例提供了一种语音检测方法,方法包括:获取目标语音,将目标语音进行预处理,预处理包括预加重、分帧及加窗;确定预处理后的目标语音的多个第一声道特征;确定预处理后目标语音的第一声源波特征;第一声源波特征是通过逆滤波器提取的;基于多个第一声道特征和第一声源波特征确定第一主成分特征;将第一主成分特征输入训练好的分类器,输出分类的结果,分类结果为伪造语音,或自然语音。
[0005]由此,本申请实施例提出的语音检测方法利用伪造语音在基频处留下的痕迹信息,利用伪造语音与自然语音由于生成过程不同而导致的出现在声源和声道特征上的差异以实现伪造语音检测。同时使用主成分分析的方法分别对声源和声道特征进行筛选,选取具有较高相关性的主成分作为特征,减少特征维度和冗余特征,提高模型的泛化能力和效率。
[0006]在一些可以实现的实施方式中,多个第一声道特征包括声道滤波器的幅频特性和逆滤波器的幅频特性,确定预处理后的目标语音的多个第一声道特征,包括:使用线性预测编码预测预处理后的目标语音每一帧的滤波器参数;根据每一帧的滤波器参数计算确定声道滤波器的幅频特性和逆滤波器的幅频特性。
[0007]由此,本申请实施例引入了多种和声道相关的特征以加强分类器的泛化能力。
[0008]在一些可以实现的实施方式中,多个第一声道特征还包括基频特征、基频微扰特征、振幅微扰特征和梅尔倒谱系数。
[0009]由此,本申请实施例引入了多种和声道相关的特征以加强分类器的泛化能力。
[0010]在一些可以实现的实施方式中,确定预处理后目标语音的第一声源波特征,包括:获取分帧后的目标语音的短时傅里叶特征;通过逆滤波器对短时傅里叶特征进行逆滤波,得到预处理后目标语音的第一声源波特征。
[0011]由此,本申请实施例使用逆滤波的方法分离声源特征和声道特征,使得分类器可以利用伪造语音与自然语音生成机理不同而引入的特异性特征进行判决,对信息的利用更充分,同时没有引入过多的数据预处理步骤。
[0012]在一些可以实现的实施方式中,基于多个第一声道特征和第一声源波特征确定第一主成分特征,包括:拼接多个第一声道特征和第一声源波特征得到第一拼接特征;第一拼接特征的特征数量为n;对第一拼接特征中的每个特征去中心化;计算去中心化的第一拼接特征的协方差矩阵;对协方差矩阵进行特征值分解,得到多个特征值和对应的特征向量;按照多个特征值从大到小的顺序,选取前k个特征向量组成转换矩阵,其中k<n;将第一拼接特征乘以转换矩阵得到第一主成分特征。
[0013]由此,本申请实施例在特征拼接的过程中引入了主成分分析以实现降维,选择出对任务更高贡献度的高相关性特征。减少冗余,以实现效率的提升。
[0014]在一些可以实现的实施方式中,方法还包括训练分类器的步骤:获取训练集带标签的训练语音,将训练语音进行预处理,预处理包括预加重、分帧及加窗;确定预处理后的训练语音的多个第二声道特征;确定预处理后的训练语音的第二声源波特征;第二声源波特征是通过声道逆滤波器提取的;基于多个第二声道特征和第二声源波特征确定第二主成分特征;将第二主成分特征输入分类器,进行迭代训练,在损失函数收敛的情况下得到训练好的分类器。
[0015]由此,本申请实施例训练得到的分类器结构简单,可移植性好。其他有益效果如前所述,此处不再赘述。
[0016]在一些可以实现的实施方式中,多个第二声道特征包括声道滤波器的幅频特性和逆滤波器的幅频特性,确定预处理后的训练语音的多个第二声道特征,包括:使用线性预测编码预测预处理后的训练语音的每一帧的滤波器参数;根据训练语音的每一帧的滤波器参数计算确定声道滤波器的幅频特性和逆滤波器的幅频特性。
[0017]在一些可以实现的实施方式中,多个第二声道特征还包括基频特征、基频微扰特征、振幅微扰特征和梅尔倒谱系数。
[0018]在一些可以实现的实施方式中,确定预处理后训练语音的第二声源波特征,包括:获取分帧后的训练语音的短时傅里叶特征;通过逆滤波器对短时傅里叶特征进行逆滤波,得到预处理后训练语音的第二声源波特征。
[0019]在一些可以实现的实施方式中,基于多个第二声道特征和第二声源波特征确定第二主成分特征,包括:拼接多个第二声道特征和第二声源波特征得到第二拼接特征;第二拼接特征的特征数量为n;对第二拼接特征中的每个特征去中心化;计算去中心化的第二拼接特征的协方差矩阵;对协方差矩阵进行特征值分解,得到n个特征值和对应的特征向量;按照多个特征值从大到小的顺序,选取前k个特征向量组成转换矩阵,其中k<n;将第二拼接特征乘以转换矩阵得到第二主成分特征。
[0020]第二方面,本申请实施例提供了一种电子设备,包括:至少一个存储器,用于存储程序;
[0021]至少一个处理器,用于执行所述存储器存储的程序,当所述存储器存储的程序被执行时,所述处理器用于执行如第一方面任意一项所述的方法。
[0022]第三方面,本申请实施例提供了一种计算机存储介质,计算机存储介质中存储有
指令,当指令在计算机上运行时,使得计算机执行第一方面中所提供的方法。
附图说明
[0023]为了更清楚地说明本说明书披露的多个实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书披露的多个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0024]下面对实施例或现有技术描述中所需使用的附图作简单地介绍。
[0025]图1是本申请实施例提供的一种本申请实施例提供的一种语音检测方法的系统架构图;
[0026]图2是本申请实施例提供的一种本申请实施例提供的一种语音检测方法的流程图;
[0027]图3是本申请实施例提供的一种本申请实施例提供的一种语音检测方法的训练流程图。
具体实施方式
[0028]为了使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图,对本申请实施例中的技本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音检测方法,其特征在于,所述方法包括:获取目标语音,将所述目标语音进行预处理,所述预处理包括预加重、分帧及加窗;确定所述预处理后目标语音的第一声道特征、第一声源波特征和多种第一相关特征;基于所述第一声道特征、第一声源波特征和多种第一相关特征确定所述第一主成分特征;将所述第一主成分特征输入训练好的分类器,输出分类的结果,所述分类结果为伪造语音,或自然语音。2.根据权利要求1所述的方法,其特征在于,所述第一声道特征包括声道滤波器的幅频特性和逆滤波器的幅频特性,所述确定所述预处理后的目标语音的第一声道特征,包括:使用线性预测编码预测预处理后的所述目标语音每一帧的滤波器参数;根据所述每一帧的滤波器参数计算确定声道滤波器的幅频特性和逆滤波器的幅频特性。3.根据权利要求1所述的方法,其特征在于,所述多种第一相关特征包括基频特征、基频微扰特征、振幅微扰特征和梅尔倒谱系数。4.根据权利要求1所述的方法,其特征在于,所述确定所述预处理后目标语音的第一声道特征、第一声源波特征和多种第一相关特征,包括:获取所述分帧后的目标语音的短时傅里叶特征;通过逆滤波器对所述短时傅里叶特征进行逆滤波,得到所述预处理后目标语音的第一声源波特征。5.根据权利要求1所述的方法,其特征在于,所述基于第一声道特征、第一声源波特征和多种第一相关特征确定第一主成分特征,包括:拼接第一声道特征、第一声源波特征和多种第一相关特征得到第一拼接特征;所述第一拼接特征的特征数量为n;对所述第一拼接特征中的每个特征去中心化;计算所述去中心化的第一拼接特征的协方差矩阵;对所述协方差矩阵进行特征值分解,得到多个特征值和对应的特征向量;按照所述多个特征值从大到小的顺序,选取前k个特征向量组成转换矩阵,其中k<n;将所述第一拼接特征乘以所述转换矩阵得到所述第一主成分特征。6.根据权利要求1

5任意一项所述的方法,其特征在于,所述方法还包括训练...

【专利技术属性】
技术研发人员:张鹏远张震陆镜泽孙旭东王文超刘睿霖王丽杜金浩陈树丽计哲
申请(专利权)人:国家计算机网络与信息安全管理中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1