伪造语音检测方法、装置、电子设备和存储介质制造方法及图纸

技术编号:37155102 阅读:23 留言:0更新日期:2023-04-06 22:15
本发明专利技术提供一种伪造语音检测方法、装置、电子设备和存储介质,其中方法包括:确定待检测的语音;将语音输入至语音检测模型中,得到语音检测模型输出的语音检测结果,语音检测结果为真实语音和伪造语音中的一种;其中,语音检测模型是根据样本语音对进行对比训练得到,样本语音对包含真实语音样本和伪造语音样本,真实语音样本和伪造语音样本的文本信息和声学特征相同。提高语音真伪检测的准确性和通用性。性。性。

【技术实现步骤摘要】
伪造语音检测方法、装置、电子设备和存储介质


[0001]本专利技术涉及语音检测
,尤其涉及一种伪造语音检测方法、装置、电子设备和存储介质。

技术介绍

[0002]自动说话人识别(automatic speaker verification,ASV)作为一种生物识别技术,可以判断当前输入语音是否为系统注册的某一个特定说话人,从而实现身份认证功能。由于其方便、无感知等特性,越来越广泛被应用在访问控制、电子商务和智能家居等情景中。然而由于语音伪造技术的发展,如文本语音合成(text to speech,TTS)和音色转换(voice conversion,VC),使得语音识别的安全性收到了威胁。
[0003]目前,伪造语音的检测方法主要是使用原始语音波形或者经过时频域变化提取各类声学特征作为前端输入,然后基于有监督的二分类训练构建可以对真伪类别分辨的模型,以实现对语音的真伪检测。但是,由于是通过学习语音中的发音区分性,使得其适配性较低,进而使得在适配程度不高的场景下,检测和识别的准确性和效果较差。

技术实现思路

[0004]本专利技术提供一种伪造语音检测方法、装置、电子设备和存储介质,用以解决现有技术中伪造语音的检测和识别的适配性和准确性较差的问题。
[0005]本专利技术提供一种伪造语音检测方法,包括:
[0006]确定待检测的语音;
[0007]将所述语音输入至语音检测模型中,得到所述语音检测模型输出的语音检测结果,所述语音检测结果为真实语音和伪造语音中的一种;r/>[0008]其中,所述语音检测模型是根据样本语音对进行对比训练得到,所述样本语音对包含真实语音样本和伪造语音样本,所述真实语音样本和所述伪造语音样本的文本信息和声学特征相同。
[0009]根据本专利技术提供的一种伪造语音检测方法,所述语音检测模型的训练步骤包括:
[0010]确定初始预训练模型和样本语音对;
[0011]根据所述初始预训练模型,对所述样本语音对进行特征提取,得到所述真实语音样本的第一特征和所述伪造语音样本的第二特征;
[0012]根据所述第一特征和所述第二特征构建损失函数,并根据所述损失函数对所述初始预训练模型进行参数迭代,得到语音预训练模型;
[0013]根据所述语音预训练模型的模型参数构建初始检测模型,并根据所述样本语音对对所述初始检测模型进行优化,得到语音检测模型。
[0014]根据本专利技术提供的一种伪造语音检测方法,所述对所述样本语音对进行特征提取,得到所述真实语音样本的第一特征和所述伪造语音样本的第二特征,包括:
[0015]对所述真实语音样本进行特征提取,得到所述真实语音样本的第一卷积特征,以
及对所述伪造语音样本进行特征提取,得到所述伪造语音样本的第二卷积特征;
[0016]对所述第一卷积特征和所述第二卷积特征分别进行掩码,并对掩码后的所述第一卷积特征和所述第二卷积特征分别进行上下文特征提取,得到第一上下文特征和第二上下文特征;
[0017]对所述第一卷积特征和所述第二卷积特征进行量化处理,得到第一量化特征和第二量化特征;
[0018]根据所述第一上下文特征和所述第一量化特征确定所述第一特征,以及根据所述第二上下文特征和所述第二量化特征确定所述第二特征。
[0019]根据本专利技术提供的一种伪造语音检测方法,所述对所述第一卷积特征和所述第二卷积特征进行掩码,包括:
[0020]确定所述样本语音对所对应的文本信息,并对所述文本信息进行分词处理;
[0021]在进行分词处理得到的词中选择若干词构成第一词集合,并确定所述第一词集合中各词的时间步;
[0022]根据所述时间步,对所述第一卷积特征和所述第二卷积特征进行掩码。
[0023]根据本专利技术提供的一种伪造语音检测方法,所述根据所述第一特征和所述第二特征构建损失函数,包括:
[0024]根据所述第一上下文特征、所述第二上下文特征、所述第一量化特征和所述第二量化特征,确定对比损失函数;
[0025]根据所述第一上下文特征和所述第二上下文特征,确定上下文特征损失函数;
[0026]根据所述对比损失函数和所述上下文特征损失函数,确定所述初始预训练模型的损失函数。
[0027]根据本专利技术提供的一种伪造语音检测方法,所述根据所述样本语音对所述初始检测模型进行优化,得到语音检测模型,包括:
[0028]根据所述初始检测模型,对所述真实语音样本和所述伪造语音样本分别进行语音检测,并根据检测所得的样本语音检测结果确定优化损失函数;
[0029]根据所述优化损失函数对所述初始检测模型进行参数迭代,得到语音检测模型。
[0030]根据本专利技术提供的一种伪造语音检测方法,所述伪造语音样本是根据所述真实语音样本的文本信息和与所述真实语音样本声学特征进行融合得到,其中所述声学特征至少包括音色特征和声纹特征。
[0031]本专利技术还提供一种伪造语音检测装置,包括:
[0032]语音获取模块,用于确定待检测的语音;
[0033]语音检测模块,用于将所述语音输入至语音检测模型中,得到所述语音检测模型输出的语音检测结果,所述语音检测结果为真实语音和伪造语音中的一种;
[0034]其中,所述语音检测模型是根据样本语音对进行对比训练得到,所述样本语音对包含真实语音样本和伪造语音样本,所述真实语音样本和所述伪造语音样本的文本信息和声学特征相同。
[0035]本专利技术还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述伪造语音检测方法的步骤。
[0036]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述伪造语音检测方法的步骤。
[0037]本专利技术提供的伪造语音检测方法、装置、电子设备和存储介质,在构建进行训练的样本语音对中的伪造语音时,使得每个样本语音对中的真实语音样本和伪造语音样本的文本信息和声学特征相同,使得所得到语音检测模型在进行真伪检测和判断时,不是通过学习发音预测任务,而是以区分真实语音和伪造语音作为优化目标,提取出分辨语音真伪的本征信息,提高了语音真伪检测的准确性和通用性。
附图说明
[0038]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图简要地说明,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0039]图1是本专利技术提供的伪造语音检测方法的流程示意图;
[0040]图2是本专利技术提供的得到语音检测模型的步骤的流程示意图;
[0041]图3是本专利技术提供的得到第一特征和第二特征的步骤的流程示意图;
[0042]图4是本专利技术提供的初始预训练本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种伪造语音检测方法,其特征在于,包括:确定待检测的语音;将所述语音输入至语音检测模型中,得到所述语音检测模型输出的语音检测结果,所述语音检测结果为真实语音和伪造语音中的一种;其中,所述语音检测模型是根据样本语音对进行对比训练得到,所述样本语音对包含真实语音样本和伪造语音样本,所述真实语音样本和所述伪造语音样本的文本信息和声学特征相同。2.根据权利要求1所述的伪造语音检测方法,其特征在于,所述语音检测模型的训练步骤包括:确定初始预训练模型和样本语音对;根据所述初始预训练模型,对所述样本语音对进行特征提取,得到所述真实语音样本的第一特征和所述伪造语音样本的第二特征;根据所述第一特征和所述第二特征构建损失函数,并根据所述损失函数对所述初始预训练模型进行参数迭代,得到语音预训练模型;根据所述语音预训练模型的模型参数构建初始检测模型,并根据所述样本语音对对所述初始检测模型进行优化,得到语音检测模型。3.根据权利要求2所述的伪造语音检测方法,其特征在于,所述对所述样本语音对进行特征提取,得到所述真实语音样本的第一特征和所述伪造语音样本的第二特征,包括:对所述真实语音样本进行特征提取,得到所述真实语音样本的第一卷积特征,以及对所述伪造语音样本进行特征提取,得到所述伪造语音样本的第二卷积特征;对所述第一卷积特征和所述第二卷积特征分别进行掩码,并对掩码后的所述第一卷积特征和所述第二卷积特征分别进行上下文特征提取,得到第一上下文特征和第二上下文特征;对所述第一卷积特征和所述第二卷积特征进行量化处理,得到第一量化特征和第二量化特征;根据所述第一上下文特征和所述第一量化特征确定所述第一特征,以及根据所述第二上下文特征和所述第二量化特征确定所述第二特征。4.根据权利要求3所述的伪造语音检测方法,其特征在于,所述对所述第一卷积特征和所述第二卷积特征进行掩码,包括:确定所述样本语音对所对应的文本信息,并对所述文本信息进行分词处理;在进行分词处理得到的词中选择若干词构成第一词集合,并确定所述第一词...

【专利技术属性】
技术研发人员:周振昆方磊王艺汝方四安柳林
申请(专利权)人:甘肃省国家安全特种技术重点实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1