【技术实现步骤摘要】
一种针对网络节点分类和链路预测的指标评测方法及系统
[0001]本专利技术涉及复杂网络节点分类和链路预测模型评测领域,特别是一种针对网络节点分类和链路预测的指标评测方法。
技术介绍
[0002]深度神经网络的发展导致了输入时自然和恶意变化的鲁棒性问题。神经网络可能在输入的过程中容易导致不可察觉的变化,最后影响神经网络的决定。这个问题存在于各种机器学习应用之中,可以通过实施各种防御机制来抵抗对抗性干扰的威胁,要么试图恢复真实语义标签,要么检测并拒绝对抗性示例或者通过不同指标数据衡量模型之间的脆弱性。在不同的模型上也会表现出对抗样本的特性,也就是说DNN模型具有非直观的特性和固有的盲点,其结构与数据分布的关系不明显,对抗样本在自然图像的区域之外运行,模型在训练期间没有接触到这些区域,因此它的行为可以被任意操纵。但现如今对于模型的指标评测分析仅仅在图像分类领域,虽然复杂网络数据与图像数据有所不同,但复杂网络节点分类和链路预测模型的鲁棒性分析还是引起了很多网络学者的关注。
[0003]已有专利:
[0004]申请号为 ...
【技术保护点】
【技术特征摘要】
1.一种针对网络节点分类和链路预测的指标评测方法,其特征在于:包括以下步骤:S1:使用cora引文网络数据集,选取最新的节点分类模型和链路预测模型,选取最新的深度学习攻击方法,将生成的对抗样本和原始样本一一对应保存;S2:将原始样本输入到最新的节点分类模型和链路预测模型得到网络图性质指标;将原始样本和攻击样本输入模型得到攻击隐蔽性指标;S3:通过指标相关性分析、筛选掉相关性过高的指标,并把输出的指标保存下来;S4:将输出指标分为训练集和验证集,训练随机森林模型,设计特征映射损失函数作为其损失函数,进行多次迭代,制作鲁棒性分析模块,使用t
‑
SNE方法对输出指标进行可视化,可视化模型鲁棒性特征。2.根据权利要求1所述的一种针对网络节点分类和链路预测的指标评测方法,其特征在于:步骤S1所述的选取最新的节点分类模型和链路预测模型,节点分类模型包括:GCN,GAT,MIXHOP模型,链路预测模型包括:GCN_VAE,ARGA_AE,ARGA_VAE模型,所述的最新的攻击方法,节点分类最新的攻击方法包括NTK,GFA,链路预测最新的攻击方法包括白盒攻击和代替模型攻击。具体包括:S1.1:使用Cora数据集作为样本数据:使用Cora数据集进行评估,该数据集共2708个样本点,每个样本点都是一篇科学论文,所有样本点被分为8个类别,类别分别是1)基于案例;2)遗传算法;3)神经网络;4)概率方法;5)强化学习;6)规则学习;7)理论,每篇论文都由一个1433维的词向量表示,所以,每个样本点具有1433个特征;词向量的每个元素都对应一个词,且该元素只有0或1两个取值。取0表示该元素对应的词不在论文中,取1表示在论文中。所有的词来源于一个具有1433个词的字典。每篇论文都至少引用了一篇其他论文,或者被其他论文引用,也就是样本点之间存在联系,没有任何一个样本点与其他样本点完全没联系。如果将样本点看做图中的点,则这是一个连通的图,不存在孤立点。其中训练集、验证集、测试集包含的节点个数分别为:140、500、1000,其中每类节点个数相同;S1.2:选取最新的节点分类模型和链路预测模型,选取最新的攻击方法,将生成的对抗样本和原始样本一一对应保存:选取最新的节点分类模型包括:GCN,GAT,MIXHOP模型,最新的链路预测模型包括:GCN_VAE,ARGA_AE,ARGA_VAE模型,选取最新的攻击方法,节点分类最新的攻击方法包括NTK,GFA,链路预测最新的攻击方法包括白盒攻击和代替模型攻击。3.根据权利要求1所述的一种针对网络节点分类和链路预测的指标评测方法,其特征在于:步骤S2具体包括:S2.1:将原始样本输入到不同参数、结构的模型得到网络图性质指标;所述的网络图性质指标如下:度中心性DC,接近中心性CC,介数中心性BC,特征向量中心性EC,聚类系数Cluster,其中DC常用来衡量节点在网络中的重要性,即一个节点的度中心性越大则意味着这个节点越重要;CC表示节点到其它所有节点距离的平均值的倒数,用于度量网络中的一个节点到其它节点的平均最短距离;BC指标为网络中所有节点对之间的最短路径中,经过某节点的最短路径的数量占所有最短路径数量的比例;EC指标用来衡量网络中节点影响力的一种度量指标,网络中节点的重要性取决于其邻居节点的数量,也取决于其邻居节点的重要性;Cluster指标表示该节点的邻居节点之间实际存在的连边占邻
居节点之间可能形成的最大连边数的比例,用来定量刻画邻居节点形成连边的概率;S2.2:将原始样本和攻击样本输入模型得到攻击隐蔽性指标;所述的攻击隐蔽性指标如下:对抗网络的最大连接部分的大小,对抗网络的
‘
三角形
’
数,对抗网络的
‘
矩形数
’
,对抗网络的幂律系数,对抗网络节点连接相似度,对抗网络的连接部分数,对抗网络的特征路径长度;其中对抗网络的最大连接部分的大小表示其子图内的每个点至少与其余点中的一个连接,且子图间没有连接,最大连接部分的大小即最大子图的尺寸;对抗网络的
‘
三角形
’
数表示对抗网络图中包含一个节点作为一个顶点的三角形数量;对抗网络的
‘
矩形
’
数:表示对抗网...
【专利技术属性】
技术研发人员:宣琦,钱佳能,王人轩,许航,邱君瀚,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。