【技术实现步骤摘要】
本专利技术涉及人工智能模型安全领域,具体为一种针对黑盒近端策略优化模型的注意力脆弱点分析方法。
技术介绍
1、随着信息社会的崛起,人工智能带来了巨大机遇,但挑战也随之而来。虽然人工智能模型在任务完成方面具备强大能力,但由于其不可解释性,安全问题一直备受关注。
2、深度强化学习(deep reinforcement learning,drl)算法是人工智能的一个重要组成部分,其通过学习策略来指导drl智能体根据环境状态采取最优行为,这种算法在机器人,自动驾驶和网络安全等各种复杂和关键任务上实现了高性能的应用。
3、策略是drl代理对状态采取动作时的概率分布,由深度神经网络(deep neuralnetwork,dnn)来拟合动作值函数。目前dnn模型面对对抗性攻击时体现出的脆弱点已被大量研究,这些研究减轻了对抗性样本对模型产生的影响。通常对抗性样本难以察觉,但在模型测试或部署时很容易误导模型产生错误判断,使模型产生脆弱点。
4、研究人员已在监督深度神经网络领域,如图像分类或自然语言处理等,探讨了各种攻击
...【技术保护点】
1.一种针对黑盒近端策略优化模型的注意力脆弱点分析方法,其特征在于,设So={si|i=1,2,...,n}为数据集D属于类别lo的输入状态,n为输入状态的维度,si表示输入状态第i维的值;T={ti|i=n,ti∈{0,1}}为特征重要性向量;是利用核密度估计算法对动作簇lp对应状态向量集合Sp拟合后的表征向量,用来代表整个状态向量集合Sp,表示表征向量第i维的值;表示生成对抗样本的总代价;为奖励函数,表示在s状态采取动作a获得的奖励值;π′()表示窃取模型的策略函数;通过上述定义构建公式(1)所示的优化问题挖掘模型脆弱点,并对脆弱点造成的影响进行实验分析:
...【技术特征摘要】
1.一种针对黑盒近端策略优化模型的注意力脆弱点分析方法,其特征在于,设so={si|i=1,2,...,n}为数据集d属于类别lo的输入状态,n为输入状态的维度,si表示输入状态第i维的值;t={ti|i=n,ti∈{0,1}}为特征重要性向量;是利用核密度估计算法对动作簇lp对应状态向量集合sp拟合后的表征向量,用来代表整个状态向量集合sp,表示表征向量第i维的值;表示生成对抗样本的总代价;为奖励函数,表示在s状态采取动作a获得的奖励值;π′()表示窃取模型的策略函数;通过上述定义构建公式(1)所示的优化问题挖掘模型脆弱点,并对脆弱点造成的影响进行实验分析:
2.根据权利要求1所述的一种针对黑盒近端策略优化模型的注意力脆弱点分析方法,其特征在于:所述步骤1中,假设挖掘黑盒目标近端策略优化模型的脆弱点,用户只能得到模型的输入输出,且访问模型次数受限。
3.根据权利要求1所述的一种针对黑盒近端策略优化模型的注意力脆弱点分析方法,其特征在于,所述步骤2具体步骤如下:
4.根据权利要求1所述的一种针对黑盒近端策略优化模型的注意力脆弱点分析方法,其特征在于,所述步骤3中样本集d的重构包含了步骤1中输出动作的类别,具体步骤如下:
5.根据权利要求1所述的一种针对黑盒近端策略优化模型的注意力脆弱点分析方法,其特征在于...
【专利技术属性】
技术研发人员:王一川,赵琛,黑新宏,任炬,刘小雪,肖叶秋,
申请(专利权)人:西安理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。