音频盲水印的编码器与解码器训练方法、嵌入和检出方法技术

技术编号：39300428 阅读：10 留言：0更新日期：2023-11-12 15:51

本申请涉及一种音频盲水印的编码器与解码器训练方法、嵌入和检出方法。所述音频盲水印的编码器与解码器训练方法包括：先获取音频训练数据对应的水印数据，并提取音频训练数据的音频时频特征；基于水印数据以及音频时频特征，对初始水印编码器与初始水印解码器进行无攻击对抗训练，得到目标水印编码器以及预训练水印解码器；获取噪声攻击数据，并基于水印数据、音频时频特征、噪声攻击数据以及目标水印编码器，对预训练水印解码器进行噪声攻击对抗训练，得到目标水印解码器。本申请对编码器和解码器分成两阶段训练，避免了噪声层中攻击必须可微分的约束，从而能够有效应对各种噪声攻击，保证盲水印嵌入检出过程的准确性。保证盲水印嵌入检出过程的准确性。保证盲水印嵌入检出过程的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
音频盲水印的编码器与解码器训练方法、嵌入和检出方法

[0001]本申请涉及计算机
，特别是涉及一种音频盲水印方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]随着计算机技术与人工智能的发展，出现了数字音频水印技术，数字音频水印技术是在不影响原始介质的条件下向其中嵌入具有特定意义且易于提取的信息的过程。音频盲水印是数字音频水印技术中的一种，具体是指提取水印数据的过程不需要原始介质参与，直接通过嵌入水印后的语音即可获取。
[0003]目前对于音频水印的处理，一般需要设计一个编码器，用来嵌入水印数据。同时设计一个解码器，用来提取水印数据。此外，还可以在编码器和解码器之间会加一个噪声层来提高模型的抗干扰能力。然而，这种方法只能应对部分攻击，抗干扰能力较差。

技术实现思路

[0004]基于此，有必要针对上述技术问题，提供一种能够有效应对各种攻击的音频盲水印的编码器与解码器训练方法、嵌入和检出方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面，本申请提供了一种音频盲水印的编码器与解码器训练方法。所述方法包括：
[0006]获取音频训练数据对应的水印数据，并提取所述音频训练数据的音频时频特征；
[0007]基于所述水印数据以及所述音频时频特征，对初始水印编码器与初始水印解码器进行无攻击对抗训练，得到目标水印编码器以及预训练水印解码器；
[0008]获取噪声攻击数据，基于所述水印数据、所述音频时频特征、所述噪声攻击数...

【技术保护点】

【技术特征摘要】
1.一种音频盲水印的编码器与解码器训练方法，其特征在于，所述方法包括：获取音频训练数据对应的水印数据，并提取所述音频训练数据的音频时频特征；基于所述水印数据以及所述音频时频特征，对初始水印编码器与初始水印解码器进行无攻击对抗训练，得到目标水印编码器以及预训练水印解码器；获取噪声攻击数据，基于所述水印数据、所述音频时频特征、所述噪声攻击数据以及所述目标水印编码器，对所述预训练水印解码器进行噪声攻击对抗训练，得到目标水印解码器。2.根据权利要求1所述的方法，其特征在于，所述提取所述音频训练数据的音频时频特征包括：对所述音频训练数据进行分帧处理，得到音频数据帧；对所述音频数据帧进行加窗处理，得到音频数据窗；对所述音频数据窗进行短时傅里叶变换，得到所述音频训练数据的音频时频特征。3.根据权利要求1所述的方法，其特征在于，所述基于所述水印数据以及所述音频时频特征，对初始水印编码器与初始水印解码器进行无攻击对抗训练，得到目标水印编码器以及预训练水印解码器包括：通过初始水印编码器将所述水印数据与所述音频时频特征进行编码处理，得到嵌水印时频特征；基于所述嵌水印时频特征得到嵌水印音频数据；根据所述嵌水印音频数据与所述音频训练数据，得到音频数据重构损失，根据所述音频时频特征与所述嵌水印时频特征，得到音频数据对抗损失；基于初始水印解码器对所述嵌水印时频特征进行水印检出处理，得到水印检出数据；对比所述水印数据与所述水印检出数据，得到水印数据重构损失；基于所述音频数据重构损失、所述音频数据对抗损失以及所述水印数据重构损失，对所述初始水印编码器以及所述初始水印解码器进行训练，得到训练完成的目标水印编码器，以及预训练水印解码器。4.根据权利要求3所述的方法，其特征在于，所述基于所述嵌水印时频特征得到嵌水印音频数据包括：对所述嵌水印时频特征进行傅里叶反变换，得到嵌水印音频数据，所述傅里叶反变换为所述短时傅里叶变换的逆过程。5.根据权利要求1所述的方法，其特征在于，所述基于所述水印数据、所述音频时频特征、所述噪声攻击数据以及所述目标水印编码器，对所述预训练水印解码器进行噪声攻击对抗训练，得到目标水印解码器包括：通过目标水印编码器对所述音频时频特征与所述水印数据进行编码处理，得到嵌水印时频特征；基于所述嵌水印时频特征得到嵌水印音频数据；通过噪声攻击数据对所述嵌水印音频数据施加噪声攻击，得到带噪音频数据；基于所述带噪音频数据得到带噪时频特征；通过所述预训练水印解码器对所述带噪时频特征进行水印检出处理，得到带噪水印数据；
基于所述带噪水印数据与所述水印数据，得到水印数据重构损失；基于所述水印数据重构损失对所述预训练水印解码器进行训练，得到目标水印解码器。6.根据权利要求5所述的方法，其特征在于，所述基于所述水印数据重构损失对所述预训练水印解码器进行训练，得到目标水印解码器之后，还包括：获取携带噪声攻击更新数据的模型调整请求；通过目标水印编码器对所述音频时频特征与所述水印数据进行编码处理，得到嵌水印时频特征；基于所述嵌水印时频特征得到嵌水印音频数...

【专利技术属性】
技术研发人员：黄磊超，杨天舒，刘华罗，刘绍腾，常勤伟，
申请(专利权)人：腾讯科技北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人