基于后门触发器的DRL模型知识产权保护方法技术

技术编号：38002917 阅读：14 留言：0更新日期：2023-06-30 10:16

本发明专利技术涉及一种基于后门触发器的DRL模型知识产权保护方法，包括以下步骤：步骤S1:由模型所有者生成水印种子集合;步骤S2:基于WMGen算法，通过水印种子修改每个状态对应的奖励值，并且改变状态对应的动作；步骤S3:Mark算法使用训练数据和水印序列重新训练模型，嵌入该后门触发器,修改每个动作对应的奖励值;步骤S4:根据步骤S2中的每个状态获得对应的APD组成验证时间水印序列TW

全部详细技术资料下载

【技术实现步骤摘要】
基于后门触发器的DRL模型知识产权保护方法

[0001]本专利技术涉及知识产权保护领域，一种基于后门触发器的DRL模型知识产权保护方法。

技术介绍

[0002]深度强化学习(Deep Reinforcement Learning,DRL)已经证明了它在各种复杂任务中的有效性，例如，机器人控制，竞争视频游戏和自动驾驶。由于出色的性能和健壮性，DRL正在加速商业化过程。由于生成一个DRL策略需要大量的计算资源和专业知识，一个训练有素的DRL模型已经成为人工智能应用程序和产品的核心知识产权(Intellectual Property,IP)。保护这些资产，防止非法抄袭、未经授权的分发和复制DRL模型是至关重要的。
[0003]将水印技术引入深度强化学习模型知识产权保护是可行且有意义的。现有两种深度强化学习模型水印方案：第一种是Vahid Behzadan提出的序列触发器水印，将水印嵌入额外的动作状态空间中。此类方案的缺点是额外的动作状态空间非常容易被攻击者所识别，进而可以轻易伪造额外的空间水印。第二种方案是Chen提出的一种时间序列水印方案，提出了一种无损失状态，强制要求整条序列的每个状态都为无损失状态，计算每个状态的动作概率分布与水印集合对应该动作的动作概率分布的KL散度作为水印。这种方案的条件过于苛刻，并且容易被攻击伪造，难以保证水印发非公平所有权。

技术实现思路

[0004]有鉴于此，本专利技术的目的在于提供一种基于后门触发器的DRL模型知识产权保护方法，解决空间水印易于被攻击者检测以及无损失...

【技术保护点】

【技术特征摘要】
1.一种基于后门触发器的DRL模型知识产权保护方法，其特征在于，包括以下步骤：步骤S1:由模型所有者生成水印种子集合；步骤S2:基于WMGen算法，通过水印种子修改每个状态对应的奖励值，并且改变状态对应的动作；步骤S3:Mark算法使用训练数据和水印序列重新训练模型，嵌入该后门触发器,修改每个动作对应的奖励值；步骤S4:根据步骤S2中的每个状态获得对应的APD组成验证时间水印序列TW^；步骤S5:通过水印种子对应的初始状态由此得到每个状态以及对应的APD组成的可疑时间序列TW
’
；步骤S6:使用Verify算法比较验证时间水印序列TW^与可疑时间序列TW
’
的距离：如果该距离JS
TW^_TW
’
小于阈值ε1，并且可疑时间序列TW
’
所对应的总奖励值R
TW
’
小于阈值ε2，则该模型为受保护模型；否则，该模型为非受保护模型。2.根据权利要求1所述的基于后门触发器的DRL模型知识产权保护方法，其特征在于，所述状态对应的奖励值由水印种子对应的初始状态的环境与智能体agent交互得到。3.根据权利要求1所述的基于后门触发器的DRL模型知识产权保护方法，其特征在于，所述WMGen算法，具体为：设WMGen生成一个数据集C，它由n条水印序列组成，每个水印序列由状态和相应的APD对组成，长度为L:TW
i
＝[(s
i,0
,P
i,0
),(s
i,1
,P
i,1
),...,(s
i,L
‑1,P
i,L
‑1)]WMGen首先生成一系列的随机种子作为水印算法的水印启动条件；每个随机种子对应环境的一个初始状态且该初始状态唯一，...

【专利技术属性】
技术研发人员：金彪，姚志强，陈瑜霖，蔡娟娟，熊金波，李逸康，
申请(专利权)人：福建师范大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人