The invention discloses a feature extraction and prediction method for dynamic network links based on structural subgraph features. By merging the same structural nodes in the subnetwork centered on the target link, the structural subgraph of dynamic network topology structure is obtained. According to the number of structural points needed to be included in the structural subgraph, the size of the structural subgraph is determined, and the extension contained in the structural subgraph is determined. The time stamp of flutter information and links is coded into structural subgraph feature vectors, and the neural network is trained to predict the probability of links to be predicted. The structural subgraph feature quantities extracted by the present invention can express the topological features of links more widely and diversifiedly than the traditional feature quantities, and the link prediction method of the present invention can greatly improve the accuracy of link prediction.
【技术实现步骤摘要】
基于结构子图特征的动态网络链接的特征提取及预测方法
本专利技术属于网络挖掘领域,涉及一种基于结构子图特征的动态网络链接的特征提取方法及预测方法。
技术介绍
人类进入21世纪以来,随着网络和信息技术的飞速发展,人们的日常生活与大量复杂多样的网络息息相关,如社交网络、通信网络、交通网络、购物网络等。这些网络有着明显的时序特性,被称为动态网络。作为动态网络中热门研究之一,链接预测旨在根据网络中已知的节点属性和结构等信息来预测网络中两个节点之间产生链接的可能性。链接预测研究有着丰富的实际应用,为社交网络和电商个性化推荐,网络图谱缺失链接补全,用户行为预测等众多领域提供核心技术支持。链接预测问题的核心是对网络中的链接进行有效的特征表达。链接在动态网络中具备怎样的拓扑特征,是区分该链接是否可能存在或者形成的关键因素。链接的拓扑特征被表达在特征量中,然后输入非监督或者监督模型中去判断该链接是否会存在或产生。多数非监督的链接预测方法利用的拓扑特征基于链接端点的公共邻居数量,如公共邻居,资源分配指数和Jaccard指数等。其他有监督的链接预测方法则通过预定义的路径来学习链接端点的可 ...
【技术保护点】
1.一种基于结构子图特征的动态网络链接的特征提取方法,其特征在于,包括:步骤1,归并以目标链接为中心的子网络中的相同结构节点,得到动态网络拓扑结构的结构子图;步骤2,根据所述结构子图需要包含的结构点个数K,确定所述结构子图的规模,得到K结构子图;步骤3,将K结构子图中蕴含的拓扑信息及链接的时间戳编码成结构子图特征向量。
【技术特征摘要】
1.一种基于结构子图特征的动态网络链接的特征提取方法,其特征在于,包括:步骤1,归并以目标链接为中心的子网络中的相同结构节点,得到动态网络拓扑结构的结构子图;步骤2,根据所述结构子图需要包含的结构点个数K,确定所述结构子图的规模,得到K结构子图;步骤3,将K结构子图中蕴含的拓扑信息及链接的时间戳编码成结构子图特征向量。2.根据权利要求1所述的一种基于结构子图特征的动态网络链接的特征提取方法,其特征在于,步骤1所述的归并以目标链接为中心的子网络中的相同结构节点,得到动态网络拓扑结构的结构子图包括:对于一个动态网络G=(V,E,L)的目标链接et=(ni,nj,lt);获取以目标链接为中心的h跳范围内的子网络,记作h跳子图归并所述子图中所有邻居相同的点,将子图中邻居相同的点归并成一个结构点,记作两个结构点和存在结构链接得到归并后的h跳子图定义h跳结构子图其中et∈E,E为所有边的集合,L为所有时间戳的集合,V为网络中所有节点的集合,ni和nj均为V中的点,lt、lk为L中的时间戳,h为大于等于1的自然数,VS为所有结构点的集合,ES为所有结构链接的集合,L′为所述结构子图中存在的所有时间戳。3.根据权利要求2所述的一种基于结构子图特征的动态网络链接的特征提取方法,其特征在于,步骤2中所述根据所述结构子图需要包含的结构点个数K,确定所述结构子图的规模,得到K结构子图包括:步骤2-1,将跳数h初始设定为1;步骤2-2,取距离链接et在h跳范围之内的所有点及其之间的链接,获得子图步骤2-3,根据步骤1获得归并后的结构子图步骤2-4,判断结构子图中的结构点的数量是否满足|VS|≥K,如果满足则执行步骤2-5,否者将h增大1,并返回步骤2-2;步骤2-5,执行Palette-WL算法为结构子图中的每个结构点标注上独一的序号;步骤2-6,舍去结构子图中序号大于K的结构点,剩下的部分保留为K结构子图,记作其中|VS|为结构子图中实际包含的结构点个数;为K结构子图中所有结构点的集合,为K结构子图中所有结构链接的集合,L′为K结构子图中存在的所有时间戳。4.根据权利要求3所述的一种基于结构子图特征的动态网络链接的特征提取方法,其特征在于,步骤3所述将K结构子图中蕴含的拓扑信息及链接的时间戳编码成结构子图特征向量包括:计算链接e=(ni,nj,ls)在当前时刻lt所产生的影响力为:其中ni和nj均为节点集合V中的点,ls为链接e的时间戳,θ为取值0到1的衰退系数;规范K结构子图中的结构链接为其中为表示中任一点,为表示中任一点,规范K结构子图中所有的结构链接,得到规范化的K结构子图其中为规范化的K结构子图中所有结构点的集合,为规范化的K结构子图中所有结构链接的集合,则是所有规范化影响力的集合;计算规范化结构子图的邻接矩阵A的规范化影响力,A的第m行第n列的元素值为:其中A(m,n)为链接的规范化影响力,当且仅当的标号为m,且的标号为n;将邻接矩阵A的右上角按列展开,得到链接et的结构子图特征向量为:其中m为邻接矩阵A的行,n为邻接矩阵A的列,K为K结构子图的结构点个数,conn(*)是一个连接函数,连接其中的元素成为向量。5.一种基于结构子图特征的动态网络链接的预测方法,其特征在于,包括:步骤1,归并以目标链接为中心的子网络中的相同结构节点,得到动态网络拓扑结构的结构子图;步骤2,根据所述结构子图需要包含的结构点个数K,确定所述结构子图的规模得到K结构子图;步骤3,将K结构子图中蕴含的拓扑信息及链接的时间戳编码成结构子图特征向量,将训练集合和测试集合中的所有链接依次作为目标链接,重复步骤1-3,提取结构子图特征向量;步骤4,利用训练集合训练神经网络,使用训练完成的神经网络来预测测试集合中待预测链接形成的概率。6.根据权利要求5所述的一种基于结构子图特征的动态网络链接的预测方法,其特征在于,步骤1所述的归并以目标链接为中心的子网络中的相同结构节点,得到动态网络拓扑结构的结构子图包括:对于一个动态网络G=(V,E,L)的目标链接et=(ni,nj...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。