The invention discloses a network representation learning system based on neighborhood information, which comprises a data input module, a network representation learning system in which a network information data set containing the association information of each network node is input, and a low-dimensional vector representation of each network node is constructed and initialized; and a target function construction module according to the data input module. The objective function of the network is constructed by the degree relation of the network and the neighbor information; the objective function optimization module uses the stochastic gradient descent algorithm to optimize the objective function, and obtains the optimal vector representation of each network node; the data output module outputs the optimal vector representation of the learned network node. The invention also discloses a network representation learning system for network representation learning. The network representation learning method of the invention makes full use of the neighbor information of the network node, and can solve the problem of sparse relationship of the network structure once, and then learns more representative node vectors.
【技术实现步骤摘要】
一种基于邻居信息的网络表示学习方法及系统
本专利技术涉及网络表示学习
,尤其涉及一种基于邻居信息的网络表示学习方法及系统。
技术介绍
真实世界中的实体互相交互形成了大规模复杂网络。传统的网络分析技术将每个网络节点看作唯一的符号,这种方法存在的稀疏性问题极大地影响了个性化推荐、异常检测等问题的效果。为了克服稀疏性问题,针对复杂网络分析的表示学习方法被提出。网络表示学习是将大规模网络中节点的信息编码到一个低维空间中,这种低维表示可以用来判断节点之间的距离远近、有无关系等,还可以作为分类和聚类等任务的特征向量。对于真实世界中的网络,节点往往拥有其他的附加信息。例如,在真实世界的电商平台中,一些卖家为了提升店铺的排名和销量通常会雇佣水军来进行刷单,恶意的刷单用户和正常的普通用户之间通常会形成一种群聚关系,即刷单用户与刷单店铺进行交易的比例占刷单用户总交易笔数较大,而普通用户与刷单店铺进行交易的比例占普通用户总交易笔数较小。这种群聚关系将他们约束在一个相似的群体中,利用这种关系可以解决网络结构一度关系稀疏性的问题,进而学习出更有代表性的节点向量以便进行后续的一些分析工作,例如识别恶意买家和卖家等。目前已有的工作,并没有将这种邻居信息考虑到表示向量的学习当中。因此,同时考虑网络结构信息以及邻居信息对于学习更好的节点表示是十分必要的。
技术实现思路
本专利技术提供了一种基于邻居信息的网络表示学习方法,该方法可以充分利用已有信息,提高网络节点表示的质量。本专利技术提供了如下技术方案:一种基于邻居信息的网络表示学习方法,包括以下步骤:(1)构建包含各个网络节点关联信息的网 ...
【技术保护点】
1.一种基于邻居信息的网络表示学习方法,其特征在于,包括以下步骤:(1)构建包含各个网络节点关联信息的网络信息数据集,所述关联信息用于表示网络的结构,构建并初始化各个网络节点的低维向量表示;(2)根据网络的一度关系和邻居信息构造网络的目标函数;(3)采用随机梯度下降算法对目标函数进行优化,得到各网络节点的最优向量表示;(4)输出学习到的网络节点的最优向量表示。
【技术特征摘要】
1.一种基于邻居信息的网络表示学习方法,其特征在于,包括以下步骤:(1)构建包含各个网络节点关联信息的网络信息数据集,所述关联信息用于表示网络的结构,构建并初始化各个网络节点的低维向量表示;(2)根据网络的一度关系和邻居信息构造网络的目标函数;(3)采用随机梯度下降算法对目标函数进行优化,得到各网络节点的最优向量表示;(4)输出学习到的网络节点的最优向量表示。2.根据权利要求1所述的基于邻居信息的网络表示学习方法,其特征在于,所述的目标函数通式为:其中,为一度关系目标函数;为邻居信息目标函数;α为常数,表示背景向量的影响系数。背景向量的影响系数可根据具体的实际需要进行设定。3.根据权利要求2所述的基于邻居信息的网络表示学习方法,其特征在于,所述的通式为:其中,S为网络中节点的个数;N(i)表示节点i的邻居数;D(x,y)为距离度量函数;vi为节点i的向量表示;表示节点i针对其每个邻居节点j的背景向量,j=1,2,K,N(i)。4.根据权利要求3所述的基于邻居信息的网络表示学习方法,其特征在于,背景向量的计算公式为:其中,N(j)表示节点j的邻居数;vk表示除了节点i之外的所有节点j的邻居节点向量。5.根据权利要求4所述的基于邻居信息的网络表示学习方法,其特征在于,同构网络的目标函数为:其中,K是负样本个数,E表示期望,vn是负样本(和节点vi不存在边关系...
【专利技术属性】
技术研发人员:纪守领,杜天宇,陈建海,
申请(专利权)人:浙江大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。