一种基于信息隐藏的模型主动防护技术制造技术

技术编号：37569611 阅读：19 留言：0更新日期：2023-05-15 07:48

本发明专利技术公开的一种基于信息隐藏的模型主动防护技术，以主动防护为基准，面向人工智能技术的发展和进步对深度神经网络模型的知识产权保护带来的挑战，提出了一种新的保护方法。我们使用原始样本和签名作为输入，利用信息隐写技术生成关键样本，且关键样本和原始数据肉眼上不可分辨，之后利用距离控制算法生成具有特殊分布的三个对抗样本，使得三个对抗样本成正三角形环绕在签名样本周边，DNN模型利用关键样本和对抗样本进行对抗训练，以此将DNN模型和我们的关键样本建立唯一性关系，以期为模型赋予主动防护功能。本发明专利技术可以实现对深度学习模型知识产权进行主动性防护。深度学习模型知识产权进行主动性防护。深度学习模型知识产权进行主动性防护。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于信息隐藏的模型主动防护技术

[0001]本专利技术属于神经网络模型知识产权保护领域，涉及信息隐藏技术、深度神经网络模型的防护技术。

技术介绍

[0002]随着人工智能技术的快速发展，深度学习技术在人脸识别、语音识别和机器翻译等各种具有挑战性的任务中取得了巨大的进步。深度神经网络(DNN)的设计、实现到部署消耗巨大，不仅需要大量的时间投入，还需要耗费大量的人力和智力资源。因此，对模型的知识产权进行保护便成为重中之重以保护模型所有者的利益。
[0003]由于深度神经网络(DNN)Error！Reference source not found.也是数字产品的一种，因此有学者借助数字产品保护技术对DNN进行保护，例如：密码学和水印技术。密码学方法通过使用加密算法对模型的结构、参数等重要数据进行加密，并仅对授权用户发放密钥，用户使用密钥对模型解密以实现正常使用。但这种方法无法控制授权用户解密模型后的行为，例如：用户将解密后的模型盗版售卖或者部署在云端并开发API以供其他用户使用，这就极大地侵犯了模型开发者的利益。还有学者将多媒体内容版权保护的数字水印方法引入深度学习领域，即在训练阶段向DNN中嵌入水印实现对侵权行为的有效追溯，当模型未经允许被私自滥用时，模型所有者可以通过水印检测证明模型专利技术者所有权并依法追究侵权行为。然而，这种技术有许多缺陷和不足，数字水印技术旨在建立起模型和专利技术者间的唯一性联系，但这种唯一性证明存在许多挑战，攻击者可以捕获关键样本以躲避验证，也可以很容易地伪造水印实现所有权的欺骗声...

【技术保护点】

【技术特征摘要】
1.一种基于信息隐藏的模型主动防护技术，其特征在于，包括如下步骤：(1)利用图片隐写网络和独有的签名生成具有特殊分布的关键样本和对抗样本，并且生成的关键样本和原始样本在肉眼上无法分辨。(2)利用生成的关键样本和对抗样本对DNN模型进行对抗训练，使得模型可以唯一性拟合关键样本，而对其他数据的预测会偏离真实值，由此建立起DNN模型正常使用和隐写网络、独有签名间的唯一性联系，进而实现对DNN模型的主动防护功能。2.根据权利要求1所述的一种基于信息隐藏的模型主动防护技术，其特征在于，引入的图像隐写网络，由编码器e和解码器d组合共同实现信息隐藏功能，可以向原始样本嵌入独有的签名图片生成隐写样本。其中编码器e供发送发使用，负责将独有的签名图片s嵌入至原始样本x中，生成和x在肉眼上不可分辨的关键样本x
key
；解码器d供接收方使用，接收输入x
key
,并可以从中解析出嵌入的签名信息s'，由此信息成功地隐秘地传播到目的地。虽然编码器e和解码器d会分开使用，但训练时要作为整体共同参与训练。3.根据权利要求1所述的一种基于信息隐藏的模型主动防护技术，其特征在于，通过为图像隐写网络的编码器e损失函数引入图片距离控制机制可以控制生成的样本和原始样本间分布距离。4.根据权利要求1所述的一种基于信息隐藏的模型主动防护技术，其特征在于，需要使用三个对抗样本来控制模型可用空间范围，通过进行对抗训练使得输入数据只有在可用的分布空间内模型才能正确使用。5.根据权利要求3所述的一种基于信息隐藏的模型主动防护技术，其特征在于，编码器e接收原始样本和独有签名s生成关键样本x
key
,且关键样本x
key
和原始样本间的分布距离为l，此保证二者分布相似的同时可...

【专利技术属性】
技术研发人员：张玉，赵旺奇，孙哲，张建忠，
申请(专利权)人：南开大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人