当前位置: 首页 > 专利查询>宁波大学专利>正文

一种动态社交网络中的链路预测方法技术

技术编号:24010798 阅读:21 留言:0更新日期:2020-05-02 01:40
本发明专利技术涉及一种动态社交网络中的链路预测方法,包括以下步骤:将t时刻网络中的节点映射到低维嵌入空间中,并写成每个节点的低维表示向量;之后分别计算t时刻网络中节点的局部特征、二阶相似性和保持网络演化平滑性对应的损失函数,最后根据最小化总损失函数得到节点最佳的低维表示向量;从而使用最佳低维表示向量方法得到测试集中的所有节点低维表示向量,并依次将每个节点对的低维表示向量输入到逻辑回归分类器中进行训练,得到训练完成的逻辑回归分类器;将T时刻网络中每个节点对的低维表示向量输入到训练完成的逻辑回归分类器中,得到T+1时刻的网络信息。该链路预测方法降低了网络中的数据存储空间且链路预测准确性更高。

A link prediction method in dynamic social network

【技术实现步骤摘要】
一种动态社交网络中的链路预测方法
本专利技术涉及链路预测领域,特别涉及一种动态社交网络中的链路预测方法。
技术介绍
随着海量数据在社交、通信、生物等网络中不断聚集,这种网络结构化的数据非常有效地模拟了现实世界中各种类型的链接数据。其中,节点表示实体,边表示实体之间的链接。对网络信息尤其是链接信息的挖掘成为了一个新兴的研究方向。链接预测是根据社会网络现有的结构,预测隐含的链接或将来可能产生的链接。链接预测除了具有很高的学术研究价值,还具有许多重要的商业应用。例如,Facebook等社交网站中推荐朋友;淘宝等电子商务网站中给用户推荐感兴趣的商品;医学研究者根据基因网络中的不规则联系找到导致疾病的基因;网络安全领域,链接预测亦可实现对垃圾邮件的检测,对实际的舆情监控系统中有着十分重要的作用。提高应用价值的关键是如何有效的挖掘到网络结构中隐含的丰富信息,提高链接预测的准确性。网络信息的有效学习方法之一是网络表示学习,旨在根据相关的优化目标,将大规模、高维度的网络嵌入到低维度的空间中,用低维稠密的向量表示网络中的节点,并且这些节点表示隐含着丰富的网络信息。利用这种网络嵌入的方法被证明在链接预测中非常有效,但目前的研究大多关注于静态网络,忽略网络的动态演化。但是,现实世界的网络是实时动态更新的,其节点和边时刻发生变化。例如,社交网络中新用户的加入、新好友关系的产生,会导致网络中出现新的节点和边;用户离开表现为节点的消失。这些时序信息是网络的重要部分,是网络的演化机制和其动力学的体现。动态网络表示学习需要同时对网络的结构及时序信息进行建模,尽可能挖掘出网络中隐含的丰富信息,是一项困难但十分重要的任务。链接预测的本质是预测节点之间是否存在链接。目前研究大多忽略网络的时间信息,获得的节点向量表示仅捕捉到当前时刻下网络的结构信息,无法捕捉到网络结构中隐含的演化趋势信息,这大大降低了链接预测的准确性。
技术实现思路
本专利技术所要解决的技术问题是针对现有技术的现状,提供一种数据存储空间更小且链路预测准确性更高的动态社交网络中的链路预测方法。本专利技术解决上述技术问题所采用的技术方案为:一种动态社交网络中的链路预测方法,用于根据动态社交网络中1到T时刻的网络信息预测T+1时刻的网络信息,将动态社交网络中T个时刻的网络用G表示,G={G1,...,GT},t时刻的网络表示为Gt=(V,Et,Wt),1≤t≤T,其中V表示t时刻网络中的节点集,Et为t时刻网络中任意两节点之间存在的边的集合,Wt为t时刻网络中任意两节点之间存在的边之间的权重集合,其特征在于:包括以下步骤:步骤1、将t时刻网络中的节点Vi映射到低维嵌入空间中,表达式为:ft:Vi→Rd;其中,Vi∈V,d为预设的低维嵌入空间的维数,d远小于节点集V中节点的个数,Rd为d维实数空间;步骤2、将t时刻网络中任意节点Vi的低维表示向量记为其中i=1,2,3...N,N为t时刻网络对应节点集中的节点总数;步骤3、选择出t时刻网络中任意两节点间具有边的所有节点对,并计算出所有节点对之间的局部特征对应的损失函数步骤4、在t时刻网络中选择出满足以下条件的节点m和节点n:任意两个不同节点m和节点n之间没有边,节点m和节点n之间具有一个或多个共同的邻居节点,则计算满足该条件的所有节点m和节点n之间的二阶相似性对应的损失函数;具体包括以下步骤:步骤4-1、在t时刻的网络中,假设任意两个不同节点m和节点n之间没有边,节点m和节点n之间具有一个或多个共同的邻居节点,将其中一个共同邻居节点记为k,计算t时刻网络中节点m和节点n受共同邻居节点k的影响程度,记为计算公式为:其中,表示节点m和节点n对共同邻居节点k的影响程度,ωmk为t时刻网络中节点m和节点k之间边的权重,ωnk为t时刻网络中节点n和节点k之间边的权重,emk为t时刻网络中节点m和节点k之间的边,enk为t时刻网络中节点n和节点k之间的边;为节点m和节点k之间的亲密程度,为节点m在t时刻网络中的影响因子,为t时刻网络中节点m的低维表示向量,为t时刻网络中节点k的低维表示向量;为节点n和节点k之间的亲密程度,为节点n在t时刻网络中的影响因子,为t时刻网络中节点n的低维表示向量;步骤4-2、计算t+1时刻,节点m和节点n受其共同邻居节点k的影响建立新边的概率,以及不受其共同邻居节点k的影响,继续保持原来社交状态的概率,并将t+1时刻,节点m和节点n受其共同邻居节点k影响的概率记为其中,σ(.)为逻辑回归函数,即θd为节点m和节点n之间是否确定建立边的实数向量,该向量与节点低维表示向量的维度数相同;y=1表示t+1时刻网络中节点m和节点n之间受其共同邻居节点k的影响建立新边;y=0表示t+1时刻网络中节点m和节点n不受其共同邻居节点k的影响未形成新边;步骤4-3、合并步骤4-2中的两个公式,得到:其中表示t+1时刻的网络中,节点m和节点n之间是否受其邻居节点k影响的概率,y=0或1;步骤4-4、当节点m和节点n之间具有多个共同邻居节点,将节点m和节点n在t时刻网络中的所有共同邻居节点集记为Nt(m,n);将节点m和节点n是否受某个共同邻居节点k1的影响在未来时刻是否建立新边的函数记为或0;表示节点m和节点n受某个共同邻居节点k1的影响在未来t+1时刻建立新边;表示节点m和节点n不受某个共同邻居节点k1的影响在未来t+1时刻不建立新边;步骤4-5、根据步骤4-3中的计算公式,计算出t+1时刻的网络中,节点m和节点n受所有共同邻居节点的影响建立新边的概率为:其中,II为连乘符号,以及计算出t+1时刻的网络中,节点m和节点n不受所有共同邻居节点的影响未建立新边的概率为:步骤4-6、在t+1时刻网络中,分为两种情况,分别对应为:节点m和节点n在t时刻的网络中无连接,在t+1时刻网络中建立连接,将满足上述条件的节点m和节点n的集合记为节点m和节点n在t时刻网络中无连接且在t+1时刻仍没有建立连接,将满足该条件的节点m和节点n的集合记为步骤4-7、计算t时刻网络中对应的损失函数计算公式为:步骤5、计算保持网络演化平滑性对应的损失函数其中1≤t≤T;步骤6、计算节点特征对应的总损失函数L,并根据最小化总损失函数得到最佳的实数参数θd和节点最佳的低维表示向量总损失函数L的计算公式为:其中,a、b和λ均为预设的权值;步骤7、找出所有从到时任意两节点之间新形成边的节点对,并将该节点对作为正样本,记为集合A,其中2≤t1≤T;找出所有从G1,到时任意两节点之间边消失的节点对作为负样本,记为集合B;从集合A和B中随机选取数目相等的节点对共同组成测试集,并使用步骤6中的最佳低维表示向量方法得到测试集中的所有节点低维表示向量,并依次将每个节点对的低维表示向量输入到逻辑回归分类器中进行训练,得到训练完成的逻辑回归分类器;本文档来自技高网
...

【技术保护点】
1.一种动态社交网络中的链路预测方法,用于根据动态社交网络中1到T时刻的网络信息预测T+1时刻的网络信息,将动态社交网络中T个时刻的网络用G表示,G={G

【技术特征摘要】
1.一种动态社交网络中的链路预测方法,用于根据动态社交网络中1到T时刻的网络信息预测T+1时刻的网络信息,将动态社交网络中T个时刻的网络用G表示,G={G1,...,GT},t时刻的网络表示为Gt=(V,Et,Wt),1≤t≤T,其中V表示t时刻网络中的节点集,Et为t时刻网络中任意两节点之间存在的边的集合,Wt为t时刻网络中任意两节点之间存在的边之间的权重集合,其特征在于:包括以下步骤:
步骤1、将t时刻网络中的节点Vi映射到低维嵌入空间中,表达式为:ft:Vi→Rd;
其中,Vi∈V,d为预设的低维嵌入空间的维数,d远小于节点集V中节点的个数,Rd为d维实数空间;
步骤2、将t时刻网络中任意节点Vi的低维表示向量记为其中i=1,2,3...N,N为t时刻网络对应节点集中的节点总数;
步骤3、选择出t时刻网络中任意两节点间具有边的所有节点对,并计算出所有节点对之间的局部特征对应的损失函数
步骤4、在t时刻网络中选择出满足以下条件的节点m和节点n:任意两个不同节点m和节点n之间没有边,节点m和节点n之间具有一个或多个共同的邻居节点,则计算满足该条件的所有节点m和节点n之间的二阶相似性对应的损失函数;具体包括以下步骤:
步骤4-1、在t时刻的网络中,假设任意两个不同节点m和节点n之间没有边,节点m和节点n之间具有一个或多个共同的邻居节点,将其中一个共同邻居节点记为k,计算t时刻网络中节点m和节点n受共同邻居节点k的影响程度,记为计算公式为:



其中,表示节点m和节点n对共同邻居节点k的影响程度,ωmk为t时刻网络中节点m和节点k之间边的权重,ωnk为t时刻网络中节点n和节点k之间边的权重,emk为t时刻网络中节点m和节点k之间的边,enk为t时刻网络中节点n和节点k之间的边;为节点m和节点k之间的亲密程度,为节点m在t时刻网络中的影响因子,为t时刻网络中节点m的低维表示向量,为t时刻网络中节点k的低维表示向量;为节点n和节点k之间的亲密程度,为节点n在t时刻网络中的影响因子,为t时刻网络中节点n的低维表示向量;
步骤4-2、计算t+1时刻,节点m和节点n受其共同邻居节点k的影响建立新边的概率,以及不受其共同邻居节点k的影响,继续保持原来社交状态的概率,并将t+1时刻,节点m和节点n受其共同邻居节点k影响的概率记为



其中,σ(.)为逻辑回归函数,即θd为节点m和节点n之间是否确定建立边的实数向量,该向量与节点低维表示向量的维度数相同;y=1表示t+1时刻网络中节点m和节点n之间受其共同邻居节点k的影响建立新边;y=0表示t+1时刻网络中节点m和节点n不受其共同邻居节点k的影响未形成新边;
步骤4-3、合并步骤4-2中的两个公式,得到:



其中表示t+1时刻的网络中,节点m和节点n之间是否受其邻居节点k影响的概率,y=0或1;
步骤4-4、当节点m和节点n之间具有多个共同邻居节点,将节点m和节点n在t时刻网络中的所有共同邻居节点集记为Nt(m,n);将节点m和节点n是否受某个共同邻居节点k1的影响在未来时刻是否建立新边的函数记为k1∈Nt(m,n);或0;表示节点m和节点n受某个共...

【专利技术属性】
技术研发人员:曹燕董一鸿邬少清
申请(专利权)人:宁波大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1