音频盲水印的编码器与解码器训练方法、嵌入和检出方法技术

技术编号:39300428 阅读:10 留言:0更新日期:2023-11-12 15:51
本申请涉及一种音频盲水印的编码器与解码器训练方法、嵌入和检出方法。所述音频盲水印的编码器与解码器训练方法包括:先获取音频训练数据对应的水印数据,并提取音频训练数据的音频时频特征;基于水印数据以及音频时频特征,对初始水印编码器与初始水印解码器进行无攻击对抗训练,得到目标水印编码器以及预训练水印解码器;获取噪声攻击数据,并基于水印数据、音频时频特征、噪声攻击数据以及目标水印编码器,对预训练水印解码器进行噪声攻击对抗训练,得到目标水印解码器。本申请对编码器和解码器分成两阶段训练,避免了噪声层中攻击必须可微分的约束,从而能够有效应对各种噪声攻击,保证盲水印嵌入检出过程的准确性。保证盲水印嵌入检出过程的准确性。保证盲水印嵌入检出过程的准确性。

【技术实现步骤摘要】
音频盲水印的编码器与解码器训练方法、嵌入和检出方法


[0001]本申请涉及计算机
,特别是涉及一种音频盲水印方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]随着计算机技术与人工智能的发展,出现了数字音频水印技术,数字音频水印技术是在不影响原始介质的条件下向其中嵌入具有特定意义且易于提取的信息的过程。音频盲水印是数字音频水印技术中的一种,具体是指提取水印数据的过程不需要原始介质参与,直接通过嵌入水印后的语音即可获取。
[0003]目前对于音频水印的处理,一般需要设计一个编码器,用来嵌入水印数据。同时设计一个解码器,用来提取水印数据。此外,还可以在编码器和解码器之间会加一个噪声层来提高模型的抗干扰能力。然而,这种方法只能应对部分攻击,抗干扰能力较差。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够有效应对各种攻击的音频盲水印的编码器与解码器训练方法、嵌入和检出方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面,本申请提供了一种音频盲水印的编码器与解码器训练方法。所述方法包括:
[0006]获取音频训练数据对应的水印数据,并提取所述音频训练数据的音频时频特征;
[0007]基于所述水印数据以及所述音频时频特征,对初始水印编码器与初始水印解码器进行无攻击对抗训练,得到目标水印编码器以及预训练水印解码器;
[0008]获取噪声攻击数据,基于所述水印数据、所述音频时频特征、所述噪声攻击数据以及所述目标水印编码器,对所述预训练水印解码器进行噪声攻击对抗训练,得到目标水印解码器。
[0009]第二方面,本申请提供了一种音频盲水印嵌入方法。所述方法包括:
[0010]获取音频数据对应的水印数据,并提取所述音频数据的目标音频时频特征;
[0011]通过上述的目标水印编码器将所述目标音频时频特征与所述水印数据进行编码处理,得到目标嵌水印时频特征;
[0012]基于所述目标嵌水印时频特征得到嵌水印音频数据。
[0013]第三方面,本申请提供了一种音频盲水印检出方法。所述方法包括:
[0014]对嵌水印音频数据进行分帧处理,得到嵌水印音频数据帧;
[0015]对所述嵌水印音频数据帧进行加窗处理以及短时傅里叶变换,得到目标嵌水印时频特征;
[0016]通过上述的目标水印解码器对所述嵌水印时频特征进行水印检出处理,得到水印检出信息。
[0017]第四方面,本申请还提供了一种音频盲水印的编码器与解码器训练装置。所述装置包括:
[0018]特征提取模块,用于获取音频训练数据对应的水印数据,并提取所述音频训练数据的音频时频特征;
[0019]第一训练模块,用于基于所述水印数据以及所述音频时频特征,对初始水印编码器与初始水印解码器进行无攻击对抗训练,得到目标水印编码器以及预训练水印解码器;
[0020]第二训练模块,用于获取噪声攻击数据,基于所述水印数据、所述音频时频特征、所述噪声攻击数据以及所述目标水印编码器,对所述预训练水印解码器进行噪声攻击对抗训练,得到目标水印解码器。
[0021]第五方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0022]获取音频训练数据对应的水印数据,并提取所述音频训练数据的音频时频特征;
[0023]基于所述水印数据以及所述音频时频特征,对初始水印编码器与初始水印解码器进行无攻击对抗训练,得到目标水印编码器以及预训练水印解码器;
[0024]获取噪声攻击数据,基于所述水印数据、所述音频时频特征、所述噪声攻击数据以及所述目标水印编码器,对所述预训练水印解码器进行噪声攻击对抗训练,得到目标水印解码器。
[0025]第六方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0026]获取音频训练数据对应的水印数据,并提取所述音频训练数据的音频时频特征;
[0027]基于所述水印数据以及所述音频时频特征,对初始水印编码器与初始水印解码器进行无攻击对抗训练,得到目标水印编码器以及预训练水印解码器;
[0028]获取噪声攻击数据,基于所述水印数据、所述音频时频特征、所述噪声攻击数据以及所述目标水印编码器,对所述预训练水印解码器进行噪声攻击对抗训练,得到目标水印解码器。
[0029]第七方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
[0030]获取音频训练数据对应的水印数据,并提取所述音频训练数据的音频时频特征;
[0031]基于所述水印数据以及所述音频时频特征,对初始水印编码器与初始水印解码器进行无攻击对抗训练,得到目标水印编码器以及预训练水印解码器;
[0032]获取噪声攻击数据,基于所述水印数据、所述音频时频特征、所述噪声攻击数据以及所述目标水印编码器,对所述预训练水印解码器进行噪声攻击对抗训练,得到目标水印解码器。
[0033]上述音频盲水印的编码器与解码器训练方法、装置、计算机设备、存储介质和计算机程序产品,通过先获取音频训练数据对应的水印数据,并提取音频训练数据的音频时频特征;从而得到用于编码器与解码器模型训练的基础数据,而后基于水印数据以及音频时频特征,对初始水印编码器与初始水印解码器进行无攻击对抗训练,得到目标水印编码器以及预训练水印解码器;通过无攻击对抗训练阶段来训练水印嵌入所用的编码器模块,由编码器模块来负责将水印信息尽可能地嵌入到音频载体中,并保证对音质无影响;最后则
是获取噪声攻击数据,并基于水印数据、音频时频特征、噪声攻击数据以及目标水印编码器,对预训练水印解码器进行噪声攻击对抗训练,得到目标水印解码器。即通过噪声攻击对抗训练来训练水印检出解码器模块,由解码器模块来从各种攻击后的含水印音频中检出水印,本申请对编码器和解码器分成两阶段训练,避免了噪声层中攻击必须可微分的约束,从而能够有效应对各种噪声攻击,保证盲水印嵌入检出过程的准确性。
附图说明
[0034]图1为一个实施例中音频盲水印的编码器与解码器训练方法的应用环境图;
[0035]图2为一个实施例中音频盲水印的编码器与解码器训练方法的流程示意图;
[0036]图3为一个实施例中现有音频水印编码器与解码器模型训练过程的流程示意图;
[0037]图4为一个实施例中无攻击对抗训练阶段的流程示意图;
[0038]图5为一个实施例中噪声攻击对抗训练阶段的流程示意图;
[0039]图6为另一个实施例中音频盲水印的编码器与解码器训练方法的流程示意图;
[0040]图7为一个实施例中通过通用解码器来实现噪声攻击对抗训练阶段的流程示意图;
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频盲水印的编码器与解码器训练方法,其特征在于,所述方法包括:获取音频训练数据对应的水印数据,并提取所述音频训练数据的音频时频特征;基于所述水印数据以及所述音频时频特征,对初始水印编码器与初始水印解码器进行无攻击对抗训练,得到目标水印编码器以及预训练水印解码器;获取噪声攻击数据,基于所述水印数据、所述音频时频特征、所述噪声攻击数据以及所述目标水印编码器,对所述预训练水印解码器进行噪声攻击对抗训练,得到目标水印解码器。2.根据权利要求1所述的方法,其特征在于,所述提取所述音频训练数据的音频时频特征包括:对所述音频训练数据进行分帧处理,得到音频数据帧;对所述音频数据帧进行加窗处理,得到音频数据窗;对所述音频数据窗进行短时傅里叶变换,得到所述音频训练数据的音频时频特征。3.根据权利要求1所述的方法,其特征在于,所述基于所述水印数据以及所述音频时频特征,对初始水印编码器与初始水印解码器进行无攻击对抗训练,得到目标水印编码器以及预训练水印解码器包括:通过初始水印编码器将所述水印数据与所述音频时频特征进行编码处理,得到嵌水印时频特征;基于所述嵌水印时频特征得到嵌水印音频数据;根据所述嵌水印音频数据与所述音频训练数据,得到音频数据重构损失,根据所述音频时频特征与所述嵌水印时频特征,得到音频数据对抗损失;基于初始水印解码器对所述嵌水印时频特征进行水印检出处理,得到水印检出数据;对比所述水印数据与所述水印检出数据,得到水印数据重构损失;基于所述音频数据重构损失、所述音频数据对抗损失以及所述水印数据重构损失,对所述初始水印编码器以及所述初始水印解码器进行训练,得到训练完成的目标水印编码器,以及预训练水印解码器。4.根据权利要求3所述的方法,其特征在于,所述基于所述嵌水印时频特征得到嵌水印音频数据包括:对所述嵌水印时频特征进行傅里叶反变换,得到嵌水印音频数据,所述傅里叶反变换为所述短时傅里叶变换的逆过程。5.根据权利要求1所述的方法,其特征在于,所述基于所述水印数据、所述音频时频特征、所述噪声攻击数据以及所述目标水印编码器,对所述预训练水印解码器进行噪声攻击对抗训练,得到目标水印解码器包括:通过目标水印编码器对所述音频时频特征与所述水印数据进行编码处理,得到嵌水印时频特征;基于所述嵌水印时频特征得到嵌水印音频数据;通过噪声攻击数据对所述嵌水印音频数据施加噪声攻击,得到带噪音频数据;基于所述带噪音频数据得到带噪时频特征;通过所述预训练水印解码器对所述带噪时频特征进行水印检出处理,得到带噪水印数据;
基于所述带噪水印数据与所述水印数据,得到水印数据重构损失;基于所述水印数据重构损失对所述预训练水印解码器进行训练,得到目标水印解码器。6.根据权利要求5所述的方法,其特征在于,所述基于所述水印数据重构损失对所述预训练水印解码器进行训练,得到目标水印解码器之后,还包括:获取携带噪声攻击更新数据的模型调整请求;通过目标水印编码器对所述音频时频特征与所述水印数据进行编码处理,得到嵌水印时频特征;基于所述嵌水印时频特征得到嵌水印音频数...

【专利技术属性】
技术研发人员:黄磊超杨天舒刘华罗刘绍腾常勤伟
申请(专利权)人:腾讯科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1