【技术实现步骤摘要】
一种基于强化学习的动态链路预测模型鲁棒性增强方法
本专利技术涉及人工智能领域,尤其是涉及一种基于强化学习的动态链路预测模型鲁棒性增强方法。
技术介绍
深度学习在各个领域取得了巨大的成功。这种高表现力的模型在图像识别、自然语言处理、图数据处理等方面比其他模型表现得更好。鉴于有着突出的性能,深度学习已被应用于一些安全关键的任务,如自动驾驶、恶意软件检测、识别和异常检测。然而,由于缺乏可解释性和鲁棒性,这使得深度模型很容易受到攻击。只是在样本上添加一些细微的扰动就会使模型的性能大幅度下降。链路预测是图数据处理的一个重要方面,早期的链路预测关注较多是静态图的链路预测,而现实中数据更多地是随时间变化的,动态图的链路预测更具有实际的意义。近期的研究表明,动态图的链路预测可以结合图卷积神经网络(GCN)和长短期记忆网络(LSTM)来实现,并有着较好的预测性能。如公开号为CN110442751A的中国专利文献公开了一种基于生成式对抗网络的动态链路预测装置,公开号为CN110413844A的中国专利文献公开了一种时空注意力深度模型的动
【技术保护点】
1.一种基于强化学习的动态链路预测模型鲁棒性增强方法,其特征在于,包括:/n(1)对原始图数据进行特征嵌入,提取嵌入向量;/n(2)将特征嵌入后的嵌入向量作为马尔科夫决策过程中的状态进行建模,输出动作为修改的连边数;/n(3)使用强化学习DDPG的训练策略,逐图增删连边,直到最后一张;/n(4)计算处理后的图数据,并输入到动态链路预测模型进行准确率预测,得到回报值;/n(5)重复步骤(3)~(4),直到设定的训练轮数,最终得到修改后的鲁棒性增强的图数据。/n
【技术特征摘要】
1.一种基于强化学习的动态链路预测模型鲁棒性增强方法,其特征在于,包括:
(1)对原始图数据进行特征嵌入,提取嵌入向量;
(2)将特征嵌入后的嵌入向量作为马尔科夫决策过程中的状态进行建模,输出动作为修改的连边数;
(3)使用强化学习DDPG的训练策略,逐图增删连边,直到最后一张;
(4)计算处理后的图数据,并输入到动态链路预测模型进行准确率预测,得到回报值;
(5)重复步骤(3)~(4),直到设定的训练轮数,最终得到修改后的鲁棒性增强的图数据。
2.根据权利要求1所述的基于强化学习的动态链路预测模型鲁棒性增强方法,其特征在于,步骤(1)中,提取嵌入向量使用的是两层的GCN模型,每一层的传播规则为:
其中,即在邻接矩阵A上加一个单位矩阵IN;是的度矩阵,即H(l)是第l层的激活单元矩阵,H(0)为特征矩阵X,W(l)为每一层的参数矩阵,σ为sigmoid激活函数,把输入值映射到[0,1]。
3.根据权利要求2所述的基于强化学习的动态链路预测模型鲁棒性增强方法,其特征在于,输出的嵌入向量表示为(y1,y2,…,yl),
(y1,y2,…,yl)=G(x1,x2,…,xl)
其中,G代表整个GCN模型,这里选择输出嵌入向量的维度与特征向量相同,(x1,x2,…,xl)表示图数据的节点特征向量。
4.根据权利要求1所述的基于强化学习的动态链路预测模型鲁棒性增强方法,其特征在于,步骤(2)中,马尔科夫决策过程是由4个元素构成的四元组<S,A,T,R>;其中,S是包含所有状态的有限集合,A是一个包含所有动作的有限集合,T为转换函数,R为奖励函数;
建模过程中,S中的一个状态由所有节点输出的嵌入向量的拼接而成,得到的向量表示为yall:
yall=(y11,y12,…y1l,y21,y22,…y2l,…,yN1,yN2,…yNl)
其中,N表示的是图中的节点数目;
A的动作设定为修改的连边数,根据图的大小来设定可以修改的最大连边数;转换函数T包含图随时间的变化以及后面时刻对前面时刻修改的继承;奖励函数R则由链路预测的预测性能决定。
5.根据权利要求1所述的基于强化学习的动态链路预测模型鲁棒性增强方法,其特征在于,步骤(3)的具体过程为:
(3-1)将步...
【专利技术属性】
技术研发人员:刘毅,王珏,陈晋音,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。