当前位置: 首页 > 专利查询>湖南大学专利>正文

一种基于线性优化封闭子图编码的链路符号预测方法技术

技术编号:37643920 阅读:25 留言:0更新日期:2023-05-25 10:10
本发明专利技术公开了一种基于线性优化封闭子图编码的链路符号预测方法,获取待预测网络并预处理,得到训练集样本和测试集样本;从训练集样本或测试集样本中任取一条边作为待预测边并提取相应的封闭子图,对封闭子图进行粗粒度加权,得到预加权邻接矩阵,再进行细粒度的线性优化加权,得到三个似然矩阵,对三个似然矩阵进行处理和拼接,得到待预测边对应的向量;遍历训练集样本和测试集样本中的所有边,重复上述方法,相应得到多个向量;将多个向量输入至训练后的全连接神经网络二分类器,经过处理,输出链路符号预测得分,从而得到待预测边的符号预测结果。该方法可以直接、简单地对封闭子图中的节点排序,链路符号预测效果更好。链路符号预测效果更好。链路符号预测效果更好。

【技术实现步骤摘要】
一种基于线性优化封闭子图编码的链路符号预测方法


[0001]本专利技术涉及数据挖掘
,尤其是涉及一种基于线性优化封闭子图编码的链路符号预测方法。

技术介绍

[0002]随着自媒体的兴起,互联网的进步以及云计算的发展,促使社交媒体互动,如订阅、关注、评论和转发等大量涌现。在过去几十年中,由于能够有效地分析网络结构,链路预测领域日趋成熟,产生了大量易于理解的方法和算法来挖掘潜在的网络交互信息。然而,一般链路预测侧重于积极互动,忽略了具有明显冲突的交互关系,如不信任和反对。因此,链路预测的一个重要的子领域,链路符号预测,考虑了社交媒体链接中的负面互动信息,具有巨大的商业价值。链路符号预测的目的是在社交网络中进行好友推荐,它可以从两个相反的交互关系中挖掘潜在信息。
[0003]链路符号预测类似于链路预测问题,是基于网络已知的链路符号来判断目标链路的符号。由于链路预测和链路符号预测都基于图结构数据来对边进行二分类,因此某些链路预测算法可以直接用于链路符号预测。当前大多数链路预测方法使用图嵌入。图嵌入将每个节点映射为一个表示向量用于具体的下游任务,如节点分类、链路预测和社区检测。图嵌入方法的优势是可以利用深度神经网络的强大拟合能力达到较高的预测精度。最近有许多专门应用于符号网络的图嵌入方法,但普遍存在两个缺点。第一,符号图的连边存在符号和方向等多种类型,因此符号图的邻域结构更加复杂,一般的图嵌入方法不能聚合不同邻域的信息。第二,目前关于符号和方向的演化机制研究较少,因此大部分图嵌入方法依赖于基于平衡理论和状态理论的假设设来计图上的信息传递机制,不能自动从邻域中学习合适的网络演化机制,泛化能力较差。

技术实现思路

[0004]针对有向符号图子图模式编码方法的空白,本专利技术实现了一种基于线性优化封闭子图编码的链路符号预测方法。它假设链路存在的可能性是它们共同近邻贡献的线性和。由于经典的线性优化方法是为无符号设计的,因此要将其应用于有符号有向图必须克服两个限制。一方面,经典的线性优化方法关注于全局图结构,因此无法在目标节点周围的封闭子图中编码层次结构。例如,在确定目标链路的符号时,封闭子图中的一阶邻居通常比二阶邻居更重要,而线性优化方法无法区分一阶和二阶邻域。此外,封闭子图中正负链接的贡献也可能不同。为了解决这一问题,本专利技术提出了一种新的权重分配策略,根据每个边到目标边的距离及其符号重新分配每个边的权重。通过这个权重分配策略可以赋予封闭子图一个层次结构。另一方面,经典的线性优化方法只考虑了出邻居的贡献。本专利技术将此假设推广到有向符号网络中两个目标节点的出邻居和入邻居的贡献。在此基础上,本专利技术提出了一种改进的线性优化方法来推导出封闭子图的似然矩阵。得到似然矩阵后,可以直接、简单地对节点排序。在线性优化编码邻接矩阵后,可以得到封闭子图中一个节点对两个目标节点的
贡献,贡献可以作为重要分数来对封闭子图中的节点进行排序。
[0005]本专利技术的目的在于提供一种基于线性优化封闭子图编码的链路符号预测方法,包括如下步骤:
[0006]S1、获取待预测网络,对待预测网络进行预处理,得到不包含孤立节点的有向符号网络,从有向符号网络中分别取边构成训练集样本和测试集样本;
[0007]S2、从训练集样本或测试集样本中任取一条边作为待预测边,提取包含待预测边的封闭子图,根据边预加权策略对封闭子图中的每条边进行粗粒度加权,得到预加权邻接矩阵,将预加权邻接矩阵输入至线性优化模型进行细粒度的线性优化加权,得到三个似然矩阵;
[0008]S3、对三个似然矩阵进行处理,相应得到三个排序后的似然矩阵,将三个排序后的似然矩阵进行拼接,得到待预测边对应的向量;
[0009]S4、从训练集样本或测试集样本中另取一条边作为待预测边直至训练集样本或测试集样本中的所有边均被提取,重复步骤S2至S3,相应得到多个向量;
[0010]S5、预设全连接神经网络二分类器并进行训练,得到训练后的全连接神经网络二分类器,将多个向量输入至训练后的全连接神经网络二分类器,经过处理,输出链路符号预测得分,根据链路符号预测得分得到待预测边对应的符号预测结果。
[0011]优选地,S1包括:
[0012]S11、获取待预测网络,消除待预测网络中边的权重,得到不包含孤立节点的有向符号网络;
[0013]S12、从不包含孤立节点的有向符号网络中删除预设比例的正边和负边,由此得到训练网络;
[0014]S13、将训练网络中的正边作为训练集正样本,将训练网络中的负边作为训练集负样本,将不包含孤立节点的有向符号网络中删除的正边作为测试集正样本,将不包含孤立节点的有向符号网络中删除的负边作为测试集负样本;
[0015]S14、将训练集正样本和训练集负样本组成训练集样本,将测试集正样本和测试集负样本组成测试集样本。
[0016]优选地,S2中从训练集样本或测试集样本中任取一条边作为待预测边,提取包含待预测边的封闭子图,具体包括:
[0017]S21、预设节点阈值,从训练集样本或测试集样本中任取一条边作为待预测边(v
i
,v
j
),提取组成待预测边(v
i
,v
j
)的节点v
i
、v
j
及其h(h≥1)阶邻居节点Γ
h
(v
i
)、Γ
h
(v
j
)组成节点集;
[0018]S22、计算节点集中包含的节点数,将节点数和预设节点阈值进行比较,若节点数小于预设节点阈值,执行步骤S23,否则,若节点数大于等于预设节点阈值,或者再无新的邻居节点可以添加,执行步骤S24;
[0019]S23、将组成待预测边(v
i
,v
j
)的节点v
i
、v
j
的h+1阶邻居Γ
h+1
(v
i
)、Γ
h+1
(v
j
)加到节点集中,执行步骤S22;
[0020]S24、结束添加邻居节点,得到待预测边(v
i
,v
j
)对应的封闭子图。
[0021]优选地,封闭子图中的边包括正边和负边,S2中根据边预加权策略对封闭子图中的每条边进行粗粒度加权,得到预加权邻接矩阵,边预加权策略具体为:
[0022]若封闭子图中的边为正边,则对应的边预加权策略为:
[0023][0024]若封闭子图中的边为负边,则对应的边预加权策略为:
[0025][0026]式中,W
xy
为封闭子图中的边(v
x
,v
y
)的权重,d((v
i
,v
j
),(v
x
,v
y
))是封闭子图中的待预测边(v
i
,v
j
)到边(v...

【技术保护点】

【技术特征摘要】
1.一种基于线性优化封闭子图编码的链路符号预测方法,其特征在于,所述方法包括:S1、获取待预测网络,对所述待预测网络进行预处理,得到不包含孤立节点的有向符号网络,从所述有向符号网络中分别取边构成训练集样本和测试集样本;S2、从所述训练集样本或测试集样本中任取一条边作为待预测边,提取包含所述待预测边的封闭子图,根据边预加权策略对所述封闭子图中的每条边进行粗粒度加权,得到预加权邻接矩阵,将所述预加权邻接矩阵输入至线性优化模型进行细粒度的线性优化加权,得到三个似然矩阵;S3、对三个所述似然矩阵进行处理,相应得到三个排序后的似然矩阵,将三个所述排序后的似然矩阵进行拼接,得到所述待预测边对应的向量;S4、从所述训练集样本或测试集样本中另取一条边作为待预测边直至训练集样本或测试集样本中的所有边均被提取,重复步骤S2至S3,相应得到多个向量;S5、预设全连接神经网络二分类器并进行训练,得到训练后的全连接神经网络二分类器,将多个所述向量输入至所述训练后的全连接神经网络二分类器,经过处理,输出链路符号预测得分,根据所述链路符号预测得分得到所述待预测边对应的符号预测结果。2.如权利要求1所述的基于线性优化封闭子图编码的链路符号预测方法,其特征在于,所述S1包括:S11、获取待预测网络,消除待预测网络中边的权重,得到不包含孤立节点的有向符号网络;S12、从所述不包含孤立节点的有向符号网络中删除预设比例的正边和负边,由此得到训练网络;S13、将所述训练网络中的正边作为训练集正样本,将所述训练网络中的负边作为训练集负样本,将所述不包含孤立节点的有向符号网络中删除的正边作为测试集正样本,将所述不包含孤立节点的有向符号网络中删除的负边作为测试集负样本;S14、将所述训练集正样本和所述训练集负样本组成训练集样本,将所述测试集正样本和所述测试集负样本组成测试集样本。3.如权利要求2所述的基于线性优化封闭子图编码的链路符号预测方法,其特征在于,所述S2中从所述训练集样本或测试集样本中任取一条边作为待预测边,提取包含所述待预测边的封闭子图,具体包括:S21、预设节点阈值,从所述训练集样本或测试集样本中任取一条边作为待预测边(v
i
,v
j
),提取组成所述待预测边(v
i
,v
j
)的节点v
i
、v
j
及其h(h≥1)阶邻居节点Γ
h
(v
i
)、Γ
h
(v
j
)组成节点集;S22、计算所述节点集中包含的节点数,将所述节点数和所述预设节点阈值进行比较,若所述节点数小于所述预设节点阈值,执行步骤S23,否则,若所述节点数大于等于所述预设节点阈值,或者再无新的邻居节点可以添加,执行步骤S24;S23、将组成所述待预测边(v
i
,v
j
)的节点v
i
、v
j
的h+1阶邻居Γ
h+1
(v
i
)、Γ
h+1
(v
j
)加到所述节点集中,执行步骤S22;S24、结束添加邻居节点,得到所述待预测边(v
i
,v
j
)对应的封闭子图。4.如权利要求3所述的基于线性优化封闭子图编码的链路符号预测方法,其特征在于,所述封闭子图中的边包括正边和负边,所述S2中根据边预加权策略对所述封闭子图中的每
条边进行粗粒度加权,得到预加权邻接矩阵,所述边预加权策略具体为:若所述封闭子图中的边为正边,则对应的边预加权策略为:若所述封闭子图中的边为负边,则对应的边预加权策略为:式中,W
xy
为封闭子图中的边(v
x
,v
y
)的权重,d((v
i
,v
j
),(v
x
,v
y<...

【专利技术属性】
技术研发人员:谭少林方志宏方遒李哲
申请(专利权)人:湖南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1