The present invention relates to a single source link prediction method based on sampling digraph. According to the common neighbor index and the adjacency matrix of the directional network, the weights between nodes in the directional network are calculated. In the network G= (V, E), the migration probability TIJ of vertex VI to VJ and the transfer matrix T that needs to be optimized in the method are obtained. The set of connected neighbor nodes_(vi) and the set of sampling paths QL(x) of vertex VI are obtained directly, the best R value is obtained, and the sample QL(x) is estimated. The size of R ensures that QL(x) becomes the epsilon approximation of RL(x) with the probability of 1_delta, and the predicted score is obtained by using Katz index.
【技术实现步骤摘要】
基于抽样的有向图的单源链接预测方法
本专利技术属于应用于带方向社交网络中链接预测方法分析,特别涉及基于抽样的有向图的单源链接预测方法。
技术介绍
社交网络正在不断融入人们的日常生活,近年来facebook、Twitter、新浪微博等社交网站层出不穷,成为信息分享和传播的重要途径,网络中的信息量每天都在以几何倍数增长,对这些海量数据的挖掘成为了研究热点,随着社交网络的不断发展,用户间的关系也趋于复杂化,如用户关系的多样性、有向性、加权性等,简单的网络已不能很好地表现社交网络的真实情况,对于类似Twitter的社交网络,用户关系的有向性是普遍存在的,因此预测连接是否存在的同时,也有必要预测链接的方向。近年来国外出现了很多链接预测的算法。其中基于相似度的算法在链接预测的时候使用得最多。在这种算法中,每个节点对被分配一个指标,这被定义为两个节点之间的相似度。所有非观察的链接根据它们的相似度排序,而当非观察到的链接之间更相似时,就可以认为它们之间应该有更高的链接存在可能。许多研究发现,社会网络中彼此接近的两个个体在很大程度上存在着很高的局部相似度。结构相似性指标可以被划分为 ...
【技术保护点】
1.基于抽样的有向图的单源链接预测方法,对于带方向的社会网络,其特征在于步骤如下:(1)根据共同邻居指标和带方向网络的邻接矩阵计算带方向网络中节点之间的权重,若为有向非带权图,则得到有向非带权图的邻接矩阵A;若为有向带权图,则得到权重矩阵wij;(2)在网络G=(V,E)中,得到顶点vi到vj的游走转移概率tij和方法中需要优化的转移矩阵T;(3)根据所查询的顶点的转移概率及转移矩阵、样本路径的条数、路径长度和邻接矩阵来随机游走,得到顶点vi的直接出连邻居节点集合Γ(vi)和抽样路径集合QL(x);(4)根据随机游走抽样算法对样本个数R近似值的生成进行估算,获得最佳的R值; ...
【技术特征摘要】
1.基于抽样的有向图的单源链接预测方法,对于带方向的社会网络,其特征在于步骤如下:(1)根据共同邻居指标和带方向网络的邻接矩阵计算带方向网络中节点之间的权重,若为有向非带权图,则得到有向非带权图的邻接矩阵A;若为有向带权图,则得到权重矩阵wij;(2)在网络G=(V,E)中,得到顶点vi到vj的游走转移概率tij和方法中需要优化的转移矩阵T;(3)根据所查询的顶点的转移概率及转移矩阵、样本路径的条数、路径长度和邻接矩阵来随机游走,得到顶点vi的直接出连邻居节点集合Γ(vi)和抽样路径集合QL(x);(4)根据随机游走抽样算法对样本个数R近似值的生成进行估算,获得最佳的R值;(5)根据VC维学习理论,估计出H的VC维大小,并根据φ的分布来计算出抽样的个数,构造(H,φ)的ε近似;估计出样本QL(x)的大小R,以保证QL(x)以1-δ的概率成为PL(x)的ε近似;(6)将所考虑的路径长度限定在一个固定的范围L内,使用Katz指标得到预测的评分对链接存在的可能性和方向做出预测。2.根据权利要求1所述的基于抽样的有向图的单源链接预测方法,其特征在于所述步骤(1)中有向非带权图的邻接矩阵A,若为有向带权图,或顶点具有属性的图,边上的权重或属性相似度矩阵为3.根据权利要求1所述的基于抽样的有向图的单源链接预测方法,其特征在于所述步骤(2)网络G=(V,E)中,所有路径均从顶点x出发,通过随机游走形成长度为L的路径,在每一个节点上,根据转移概率来选择路径上的下一个节点,定义由顶点vi到vj的游走转移概率为且根据游走转移概率...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。