一种针对黑盒近端策略优化模型的注意力脆弱点分析方法技术

技术编号:41437629 阅读:37 留言:0更新日期:2024-05-28 20:31
本发明专利技术公开了一种针对黑盒近端策略优化模型的注意力脆弱点分析方法,包括以下步骤:步骤1,收集目标模型的输入状态以及输出动作;步骤2,创建与目标模型功能接近的窃取模型;步骤3,构建样本集;步骤4,样本集筛选:在样本集D中,根据设定的距离阈值条件,选择满足条件的两个动作类别;步骤5,计算特征重要性矩阵,构建随机森林,计算特征重要性矩阵T;步骤6,构建对抗样本;步骤7,模型脆弱点挖掘。本发明专利技术提出的脆弱点分析方案适用于多个实现版本的近端策略优化模型,其中的脆弱点会导致模型策略获得奖励的平均值降低约35%。

【技术实现步骤摘要】

本专利技术涉及人工智能模型安全领域,具体为一种针对黑盒近端策略优化模型的注意力脆弱点分析方法


技术介绍

1、随着信息社会的崛起,人工智能带来了巨大机遇,但挑战也随之而来。虽然人工智能模型在任务完成方面具备强大能力,但由于其不可解释性,安全问题一直备受关注。

2、深度强化学习(deep reinforcement learning,drl)算法是人工智能的一个重要组成部分,其通过学习策略来指导drl智能体根据环境状态采取最优行为,这种算法在机器人,自动驾驶和网络安全等各种复杂和关键任务上实现了高性能的应用。

3、策略是drl代理对状态采取动作时的概率分布,由深度神经网络(deep neuralnetwork,dnn)来拟合动作值函数。目前dnn模型面对对抗性攻击时体现出的脆弱点已被大量研究,这些研究减轻了对抗性样本对模型产生的影响。通常对抗性样本难以察觉,但在模型测试或部署时很容易误导模型产生错误判断,使模型产生脆弱点。

4、研究人员已在监督深度神经网络领域,如图像分类或自然语言处理等,探讨了各种攻击和防御方法来对模型的本文档来自技高网...

【技术保护点】

1.一种针对黑盒近端策略优化模型的注意力脆弱点分析方法,其特征在于,设So={si|i=1,2,...,n}为数据集D属于类别lo的输入状态,n为输入状态的维度,si表示输入状态第i维的值;T={ti|i=n,ti∈{0,1}}为特征重要性向量;是利用核密度估计算法对动作簇lp对应状态向量集合Sp拟合后的表征向量,用来代表整个状态向量集合Sp,表示表征向量第i维的值;表示生成对抗样本的总代价;为奖励函数,表示在s状态采取动作a获得的奖励值;π′()表示窃取模型的策略函数;通过上述定义构建公式(1)所示的优化问题挖掘模型脆弱点,并对脆弱点造成的影响进行实验分析:

2.根据权利要...

【技术特征摘要】

1.一种针对黑盒近端策略优化模型的注意力脆弱点分析方法,其特征在于,设so={si|i=1,2,...,n}为数据集d属于类别lo的输入状态,n为输入状态的维度,si表示输入状态第i维的值;t={ti|i=n,ti∈{0,1}}为特征重要性向量;是利用核密度估计算法对动作簇lp对应状态向量集合sp拟合后的表征向量,用来代表整个状态向量集合sp,表示表征向量第i维的值;表示生成对抗样本的总代价;为奖励函数,表示在s状态采取动作a获得的奖励值;π′()表示窃取模型的策略函数;通过上述定义构建公式(1)所示的优化问题挖掘模型脆弱点,并对脆弱点造成的影响进行实验分析:

2.根据权利要求1所述的一种针对黑盒近端策略优化模型的注意力脆弱点分析方法,其特征在于:所述步骤1中,假设挖掘黑盒目标近端策略优化模型的脆弱点,用户只能得到模型的输入输出,且访问模型次数受限。

3.根据权利要求1所述的一种针对黑盒近端策略优化模型的注意力脆弱点分析方法,其特征在于,所述步骤2具体步骤如下:

4.根据权利要求1所述的一种针对黑盒近端策略优化模型的注意力脆弱点分析方法,其特征在于,所述步骤3中样本集d的重构包含了步骤1中输出动作的类别,具体步骤如下:

5.根据权利要求1所述的一种针对黑盒近端策略优化模型的注意力脆弱点分析方法,其特征在于...

【专利技术属性】
技术研发人员:王一川赵琛黑新宏任炬刘小雪肖叶秋
申请(专利权)人:西安理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1