【技术实现步骤摘要】
基于显式时间和级联注意力的信息流行度预测方法和系统
[0001]本专利技术涉及社交网络及其应用
,尤其是指一种基于显式时间和级联注意力的信息流行度预测方法和系统。
技术介绍
[0002]在线社交网络的流行在很大程度上改变了人们的日常生活,人们作为社交用户活跃于如微博、微信、Twitter等各个社交网络平台中。人们可以在平台上通过发布推文来分享有趣的信息或者参与其它推文的转发(repost)。而信息被用户不断转发的过程就形成了信息传播,其构成的结构被称为级联(cascade),如图1所示。
[0003]信息的流行度可以用级联的规模来衡量,即参与信息转发的用户数量。一条信息被发布出来,如果它吸引了大量的用户,即具有高流行度 (popularity),那么该信息的影响力是极大的。商家可以根据信息的流行度来做决策(如广告、推荐)以获取收益。因此,利用观测信息级联过程去预测其未来的流行度对商业、社会应用是具有重要意义的。
[0004]社交网络中的级联具有时效性,每个参与转发的用户都有相应的转发时间,短时间内存在大量转发行为的信息常具有高流行度,比如微博热搜话题下的推文在几小时内就可以得到成百上千的转发量,因此时间信息是影响级联流行度的重要因素之一。此外,如图1右侧所示,用户的转发具有结构性和顺序性,其分别对应级联传播图和级联序列信息。级联传播图是重要的级联角色信息,它由参与级联的用户和转发关系边组成,反映了用户之间的影响关系。譬如中心节点比叶节点更具有影响力而有助于贡献流行度。传播序列是由参与级联的节点按 ...
【技术保护点】
【技术特征摘要】
1.一种基于显式时间和级联注意力的信息流行度预测方法,其特征在于,包括:S1:提取观测级联样本中的级联图、级联序列和级联节点对应的转发时间序列,使用显式时间嵌入模型将所述转发时间转化为包含时间属性的向量,将所述包含时间属性的向量与节点自身的向量拼接得到特征向量;S2:使用级联注意力网络映射所述级联图和级联序列得到级联表示;S3:将所述级联表示输入多层感知机得到所述观测级联样本中每条信息的预测流行度,根据所述预测流行度和实际流行度值建立损失函数;S4:使用所述观测级联样本训练所述显式时间嵌入模型、级联注意力网络和多层感知机,直到所述损失函数收敛停止训练得到训练完成的显式时间嵌入模型、级联注意力网络和多层感知机;S5:将待预测的级联样本输入所述训练完成的显式时间嵌入模型、级联注意力网络和多层感知机得到预测结果。2.根据权利要求1所述的基于显式时间和级联注意力的信息流行度预测方法,其特征在于:所述提取观测级联样本中的级联图、级联序列和级联节点对应的转发时间序列,使用显式时间嵌入模型将所述转发时间转化为包含时间属性的向量,将所述包含时间属性的向量与节点自身的向量拼接得到特征向量,具体为:S1
‑
1:获取观测级联样本,根据所述观测级联样本中的每条信息p建立观测级联从中提取级联图和级联序列每个级联节点v
i
所对应的转发时间t
i
构成转发时间序列S1
‑
2:使用显式时间嵌入模型将所述转发时间序列转化为时间向量矩阵H
t
,将所述时间向量矩阵H
t
与节点自身的特征矩阵X拼接得到新的特征矩阵3.根据权利要求2所述的基于显式时间和级联注意力的信息流行度预测方法,其特征在于:所述使用级联注意力网络映射所述级联图和级联序列得到级联表示,具体为:所述级联注意力网络包括级联图注意力网络和级联序列注意力网络,使用所述级联图注意力网络将所述级联图映射为级联图表示H
g
,使用所述级联序列注意力网络将所述级联序列映射为级联序列表示H
s
,拼接所述H
g
和H
p
得到所述级联表示H
c
。4.根据权利要求2所述的基于显式时间和级联注意力的信息流行度预测方法,其特征在于:根据所述观测级联样本中的每条信息p建立观测级联从中提取级联图和级联序列每个级联节点v
i
所对应的转发时间t
i
构成转发时间序列具体为:设置观测时间窗口[t0,t
b
),t0表示信息发布时间,t
b
表示观测时间;设置转发结束时间t
e
,t
e
满足t
e
>>t
b
;定义信息p的流行度为增长流行度||表示集合的元素个数,表示信息的观测流行度,表示传播结束后信息的流行度;所述观测级联为v
i
表示观测级联中的节点,v
j
表示v
i
的后继转发节点,t
j
表示v
j
的转发时间,n表示节点数量;所述级联图为
表示级联中的转发节点集合,ε
p
表示级联中的转发边集合;按照节点参与级联的时间从小到大排序得到级联序列为小到大排序得到级联序列为将观测时间内节点根据转发时间所构成的线性序列作为转发时间序列5.根据权利要求2所述的基于显式时间和级联注意力的信息流行度预测方法,其特征在于:所述使用显式时间嵌入模型将所述转发时间序列转化为时间向量矩阵H
t
,具体为:建立转发时间t的线性函数f
l
(t)=w
l
t+b
l
,线性函数生成的时间向量为h
l
,w
l
表示f
l
(t)的可学习权重,b
l
表示f
l
(t)的可学习偏置;建立转发时间t的周期性函数f
p
(t)=cos(w
p
t+b
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。