当前位置: 首页 > 专利查询>清华大学专利>正文

一种异构网络链接关系的预测方法及系统技术方案

技术编号:10241414 阅读:178 留言:0更新日期:2014-07-23 13:37
本发明专利技术公开一种异构网络链接关系的预测方法及系统,该方法包括:S1.将异构网络中实体进行预处理,得到训练集,其中,所述训练集包括:通过预处理得到的各实体的可观测属性特征及各实体的可观测的链接关系;S2.根据异构网络中结点类型、结点个数及预设的结点隐特征向量,建立异构网络链接关系预测模型;S3.基于最大熵判别式准则,对所述模型进行优化,得到优化后的链接关系预测模型;S4.通过所述训练集训练所述优化后的链接关系预测模型,得到训练后的链接关系预测模型;S5.通过训练后的链接关系预测模型预测异构网络链接关系。

【技术实现步骤摘要】
一种异构网络链接关系的预测方法及系统
本专利技术涉及计算机应用领域,具体涉及一种异构网络链接关系的预测方法及系统。
技术介绍
链接关系预测是网络数据统计分析的首要任务。现有的异构网络链接关系的预测方法包括:1)在显示空间中的随机游走及其变体;例如,BackstromL.等人提出的“SupervisedRandomWalks:PredictingandRecommendingLinksinSocialNetworks”,inWSDM,2011;2)在隐式空间中的低秩分解(例如Menon等人提出的“LinkPredictionviaMatrixFactorization”,inECML2011)、非参数隐特征模型(例如Miller等人提出的“NonparametricLatentFeatureModelsforLinkPrediction”,inNIPS2009)等。然而,这些方法没有利用实体的属性信息或是将实体的属性作为人工输入的额外附加信息,没有考虑实体和属性之间的相互作用,因此也就无法对二者同时建模。也就不能实现多种节点间的链接关系预测。
技术实现思路
本专利技术所要解决的技术问题是现有的异构网络链接关系的预测方法没有考虑实体和属性间的相互作用,无法实现多种节点间的链接关系预测的问题。为此目的,本专利技术提出一种异构网络链接关系的预测方法,该方法包括:S1.将异构网络中实体进行预处理,得到训练集,其中,所述训练集包括:通过预处理得到的各实体的可观测属性特征及各实体的可观测的链接关系;S2.根据异构网络中结点类型、结点个数及预设的结点隐特征向量,建立异构网络链接关系预测模型;S3.基于最大熵判别式准则,对所述模型进行优化,得到优化后的链接关系预测模型;S4.通过所述训练集训练所述优化后的链接关系预测模型,得到训练后的链接关系预测模型;S5.通过训练后的链接关系预测模型预测异构网络链接关系。其中,在步骤S2中,所述异构网络包括:N个实体结点及M个属性结点,其中N和M为正整数,任意一个实体结点i的KN维隐特征向量为ui,i≤N,任意一个属性结点j的KM维隐特征向量为vj,j≤M,i,j均为正整数,其中KN和KM为预设值,且KN≠KM;所述链接关系预测模型包括:实体结点-实体结点链接关系预测模型及实体结点-属性结点链接关系预测模型;所述实体结点-实体结点链接关系预测模型为:f(ui,uk;WN)=Tr(WNukuiT);其中,Tr(WNujuiT)为矩阵WNujuiT的迹,uiT为ui的转置,WN为权值矩阵,uk和ui分别为异构网络中的实体结点k和i的KN维隐特征向量,i≠k,i≤N,k≤N且i和k为正整数;所述实体结点-属性结点链接关系预测模型为:f(ui,vj;WM)=Tr(WMvjuiT);其中,ui和vj分别为异构网络中的实体结点i的KN维隐特征向量和属性结点j的KM维隐特征向量,uiT为ui的转置,WM为权值矩阵,Tr(WMvjuiT)为矩阵WMvjuiT的迹。其中,在步骤S3中,所述优化后的链接关系预测模型包括:优化后的实体结点-实体结点链接关系预测模型:优化后的实体结点-属性结点链接关系预测模型:式中,sign(x)为指示函数,即当x>=0时,sign(x)=1,当x<0时,sign(x)=-1,其中,U为N个实体结点的隐特征向量构成的矩阵,即U=[u1T;u2T;…;uNT],q(U)为U的后验概率分布,q(WN)为WN的后验概率分布;为在后验概率分布q(U)及q(WN)条件下求f(ui,uk;WN)的期望;其中,其中,V为M个属性结点的隐特征向量构成的矩阵,即V=[v1T;v2T;…;vMT],q(V)为V的后验概率分布,q(WM)为WM的后验概率分布;其中,为实体结点-实体结点链接关系预测值,为实体结点-属性结点链接关系预测值。本专利技术还提出一种异构网络链接关系的预测系统,其特征在于,所述系统包括:训练集生成模块,用于将异构网络中实体进行预处理,得到训练集,其中,所述训练集包括:通过预处理得到的各实体的可观测属性特征及各实体的可观测的链接关系;预测模型建立模块,用于根据异构网络中结点类型、结点个数及预设的结点隐特征向量,建立异构网络链接关系预测模型;预测模型优化模块,用于基于最大熵判别式准则,对预测模型进行优化,得到优化后的链接关系预测模型;预测模型训练模块,用于通过所述训练集训练所述优化后的链接关系预测模型,得到训练后的链接关系预测模型;链接关系预测模块,用于通过训练后的链接关系预测模型预测异构网络链接关系。相比于现有技术,本专利技术提供的方法的有益效果是:通过构建最大间隔隐特征实体-属性关系网络链接预测模型,克服了现有的异构网络链接关系的预测方法没有考虑实体和属性间的相互作用,无法实现多种节点间的链接关系预测的问题以及能够提高异构网络链接关系的预测精度。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示出了一种异构网络链接关系的预测方法流程图;图2示出了一种异构网络链接关系的预测系统结构图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。一种异构网络链接关系的预测方法,如图1所示,该方法包括:S1.将异构网络中实体进行预处理,得到训练集,其中,所述训练集包括:通过预处理得到的各实体的可观测属性特征及各实体的可观测的链接关系;比如,异构网络中有用户实体A、B和C,其中A与B相连,B与C相连,则对于用户实体A、B或C,其可观测属性特征包括性别、年龄等,可观测的链接关系为A与B、B与C。而A与C之间的链接关系不是直接可观测到的,需要进行预测,将A、B和C称为实体结点,A、B或C的性别和年龄则为属性结点。S2.根据异构网络中结点类型、结点个数及预设的结点隐特征向量,建立异构网络链接关系预测模型;本专利技术实施例中,步骤S2中所述异构网络包括:N个实体结点及M个属性结点,其中N和M为正整数,任意一个实体结点i的KN维隐特征向量为ui,i≤N,任意一个属性结点j的KM维隐特征向量为vj,j≤M,i,j均为正整数,其中KN和KM为预设值,且KN≠KM。本专利技术实施例中,即向量中的每个元素的取值为0或1,比如,对于KN=3,KM=2的情况,ui∈{[0,0,0]T、[0,0,1]T、[0,1,0]T、[0,1,1]T、[1,0,0]T、[1,0,1]T、[1,1,0]T、[1,1,1]T};vj∈{[0,0]T、[0,1]T、[1,0]T、[1,1]T}。因此,所有实体结点的隐特征向量构成的矩阵表示为U=[u1T;u2T;…;uNT],所有属性结点的隐特征向量构成的矩阵表示为V=[v1T;v2T;…;vMT]。所述链接关系预测模型本文档来自技高网...
一种异构网络链接关系的预测方法及系统

【技术保护点】
一种异构网络链接关系的预测方法,其特征在于,该方法包括:S1.将异构网络中实体进行预处理,得到训练集,其中,所述训练集包括:通过预处理得到的各实体的可观测属性特征及各实体的可观测的链接关系;S2.根据异构网络中结点类型、结点个数及预设的结点隐特征向量,建立异构网络链接关系预测模型;S3.基于最大熵判别式准则,对所述模型进行优化,得到优化后的链接关系预测模型;S4.通过所述训练集训练所述优化后的链接关系预测模型,得到训练后的链接关系预测模型;S5.通过训练后的链接关系预测模型预测异构网络链接关系。

【技术特征摘要】
1.一种异构网络链接关系的预测方法,其特征在于,该方法包括:S1.将异构网络中实体进行预处理,得到训练集,其中,所述训练集包括:通过预处理得到的各实体的可观测属性特征及各实体的可观测的链接关系;S2.根据异构网络中结点类型、结点个数及预设的结点隐特征向量,建立异构网络链接关系预测模型;S3.基于最大熵判别式准则,对所述模型进行优化,得到优化后的链接关系预测模型;S4.通过所述训练集训练所述优化后的链接关系预测模型,得到训练后的链接关系预测模型;S5.通过训练后的链接关系预测模型预测异构网络链接关系;在步骤S2中,所述异构网络包括:N个实体结点及M个属性结点,其中N和M为正整数,任意一个实体结点i的KN维隐特征向量为ui,i≤N,任意一个属性结点j的KM维隐特征向量为vj,j≤M,i,j均为正整数,其中KN和KM为预设值,且KN≠KM;所述链接关系预测模型包括:实体结点-实体结点链接关系预测模型及实体结点-属性结点链接关系预测模型;所述实体结点-实体结点链接关系预测模型为:f(ui,uk;WN)=Tr(WNukuiT);其中,Tr(WNukuiT)为矩阵WNukuiT的迹,uiT为ui的转置,WN为权值矩阵,uk和ui分别为异构网络中的实体结点k和i的KN维隐特征向量,i≠k,i≤N,k≤N且i和k为正整数;所述实体结点-属性结点链接关系预测模型为:f(ui,vj;WM)=Tr(WMvjuiT);其中,ui和vj分别为异构网络中的实体结点i的KN维隐特征向量和属性结点j的KM维隐特征向量,uiT为ui的转置,WM为权值矩阵,Tr(WMvjuiT)为矩阵WMvjuiT的迹。2.根据权利要求1所述的方法,其特征在于,在步骤S3中,所述优化后的链接关系预测模型包括:优化后的实体结点-实体结点链接关系预测模型:优化后的实体结点-属性结点链接关系预测模型:式中,sign(x)为指示函数,即当x>=0时,sign(x)=1,当x<0时,sign(x)=-1,其中,U为N个实体结点的隐特征向量构成的矩阵,...

【专利技术属性】
技术研发人员:陈宁朱军夏飞张傲南
申请(专利权)人:清华大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1