一种基于传播路径间与传播路径内影响力建模的信息传播预测方法及系统技术方案

技术编号:36526299 阅读:10 留言:0更新日期:2023-02-01 16:05
一种基于传播路径间与传播路径内影响力建模的信息传播预测方法及系统,涉及信息传播预测技术领域,用以解决在一段时间之后信息在社交网络中流行度增长量的预测问题。本发明专利技术的技术要点包括:使用图神经网络对级联图进行建模,得到聚合邻居节点状态与特征的节点表示;通过深度游走算法对整体级联网络图进行采样,获得级联图的序列集合,将图形神经网络嵌入表示与Deepwalk嵌入表示进行拼接来更新序列中各个节点的信息;将附有邻居信息的节点表示序列输入双向LSTM中,同时将时序信息经过注意力机制引导对序列进行整合,增强了级联预测模型的理解能力与预测能力。本发明专利技术兼顾级联传播路径间与传播路径内影响力传递性,以及纳入时序与结构因素互补性的有效性。与结构因素互补性的有效性。与结构因素互补性的有效性。

【技术实现步骤摘要】
一种基于传播路径间与传播路径内影响力建模的信息传播预测方法及系统


[0001]本专利技术涉及信息传播预测
,具体涉及一种基于传播路径间与传播路径内影响力 建模的信息传播预测方法及系统。

技术介绍

[0002]随着互联网和移动设备功能的增强,用户日益增长,在线社会网络平台成为用户发表意 见、表达思想的重要途径,极大的促进了信息的产生和传播。面对如此鱼目混杂的信息,不 仅为平台的管理者带来管理失控的威胁,也会对广大用户造成信息过载的困扰。做好在线网 络中的信息传播预测,可以提前从海量的信息中预测并筛选出来未来的爆发式热门消息,从 而为平台管理者提供科学的管理指导,也为用户筛选信息起到很好的过滤作用。然而,网络 中用户的相互关注与转发行为,促成了信息级联现象

当前用户的信息传播行为会带动与其相 关联的其他用户的信息传播行为,这种级联效应以及平台的开放性,为信息传播预测带来一 定的挑战。
[0003]信息传播预测从研究方法上一般分为三类。(1)基于特征的方法,在观测时间窗口内, 提取一些特征,比如内容特征,用户特征,结构特征,时序特征,通过未来的流行度,直接 做监督信息来进行学习,然而特征的提取有很强的人为主观因素,且不具有普适性。(2)生 成式方法,主要把现实网络中社会现象描述成一系列连续时间域中的事件序列,将信息的传 播积累看成是一个转发行为的到达过程,主要侧重于对每条信息转发过程中的速率函数独立 建模。代表性工作主要有增强泊松过程,以及霍克斯点过程,这些模型不受未来的预测信息 监督,预测性能受到一定的影响。(3)基于深度学习的方法,近来受深度学习模型在多个领 域表现优异的启发,(3)基于深度学习的来进行级联预测的方法应运而生,旨在通过端到端 的方式对消息的传播结构,参与用户,传播的消息内容,传播事件发生的时序信息进行自动 地深度表示,进行单因素或者多因素融合来对信息级联最终的规模进行预测,特别地,对结 构因素进行建模时,他们第一步将传播级联图通过多重随机游走,得到一组传播级联路径的 集合。每条级联路径不仅可以携带消息传递者的信息,而且刻画信息流的流向路径。
[0004]然而,现有方法通过随机游走建模的每条传播路径彼此独立,相互之间毫无联系。现实 情况中,每条传播路径间的用户经过多轮传播其重要程度,影响力是不断变化的,因此,现 有方法忽略了不同传播路径之间彼此关联的事实。此外,现有的深度学习的方法中,普遍忽 略了信息传播中至关重要的时序因素,因此,如何更好地在神经网络信息传播级联预测方法 中融入时序因素也是需要关注的问题。

技术实现思路

[0005]鉴于以上问题,本专利技术提出一种基于传播路径间与传播路径内影响力建模的信息传播预 测方法及系统,旨在提供一种基于传播路径内(Intra

path)与传播路径间(Inter

path)影响力建 模的信息传播预测方法,融合传播结构因素与时序因素来进行社交网络中信息的流行度增量 预测。
[0006]根据本专利技术的一方面,提供一种基于传播路径间与传播路径内影响力建模的信息传播预 测方法,该方法包括以下步骤:
[0007]步骤一、获取历史信息传播数据集;
[0008]步骤二、根据历史信息传播数据集训练基于图卷积时空耦合神经网络的信息传播预测模 型;
[0009]步骤三、将待预测信息数据输入训练好的信息传播预测模型中,获取待预测信息数据的 信息传播预测结果。
[0010]进一步地,步骤二中所述基于图卷积时空耦合神经网络的信息传播预测模型构建如下:
[0011]1)深度图嵌入表示:利用图卷积神经网络模型表示信息传播级联图中的每个节点,获得 聚合邻居节点信息的节点表示即图嵌入表示P
g

[0012]2)Deepwalk级联序列采样:利用深度游走算法对信息传播级联图进行采样,得到K条 长度为N的级联传播路径序列,经过深度游走算法的训练获得每个节点的特征表示即序列嵌 入表示P
w
;将图嵌入表示P
g
与序列嵌入表示P
w
进行拼接以对节点的表示进行更新;
[0013]3)信息传播级联图结构因素建模:将表示更新后的节点序列分别输入双向长短时记忆模 型中,得到信息传播级联图的结构特征表示A;
[0014]4)信息传播级联图时序因素建模:使用门控循环单元模型提取时序特征表示M,通过注 意力机制,时序信息指导下赋予不同的级联序列不同的权重,获得融合时序因素与结构因素 的信息传播级联图的最终表示O。
[0015]进一步地,所述深度图嵌入表示中获得聚合邻居节点信息的节点表示即图嵌入表示P
g
的 具体过程包括:
[0016]对于信息传播级联图中的任意节点v在m+1层的表示,消息传播的聚合函数表示为:
[0017][0018][0019]式中,AGG表示消息传播的聚合函数;为第m层的节点特征表示;N(v)表示节点v的 邻居节点集合;w表示一个可训练的权重矩阵;b表示偏差修正向量;
[0020]更新函数表示为:
[0021][0022]式中,σ表示sigmod非线性激活函数;表示节点v在第m层的特征表示;
[0023]用矩阵的方式来表示图神经网络节点间的传播与更新:
[0024][0025]其中,H表示节点的嵌入表示;表示邻接矩阵,表示节点之间的相互连接
关系, 为单位矩阵;D是一个对角阵,为矩阵A的度矩阵;w表示一个可训练的 权重矩阵;b表示偏差修正向量;每个节点的特征向量表示为
[0026]进一步地,所述Deepwalk级联序列采样中对信息传播级联图进行采样,获得每个节点的 特征表示即序列嵌入表示P
w
的具体过程包括:
[0027]采样K条长度为N的级联序列的过程为:根据下述公式确定路径的起始点:
[0028][0029]其中,deg
i
(v)表示节点v在信息传播级联图中出度的大小;α为平滑量;deg
i
(w)表示节 点w在信息传播级联图中出度的大小,V
c
表示节点w的邻居节点集合;
[0030]确定起始节点v后,在信息传播级联图中其出度邻居结点的集合为N
i
(v),则其前往下一 个出度邻居由下述公式确定:
[0031][0032]当邻居节点的采样长度达到设定值N,或者没有下一个邻居结点时,当前采样序列结束; 当序列的数目达到设定值K时,随机游走采样结束,得到K条信息传播级联图的传播路径;
[0033]基于自然语言处理领域中的Word2Vector模型,视每个节点为单个的单词,每条传播路 径视为一个句子;级联序列中的每个节点被表示为一个独热向量其中|U
i
|表示信息 传播级联图中节点的总数;通过一个嵌入矩阵将每个节点转换成一个低维稠密向量y,将向量 y输入Skip
...

【技术保护点】

【技术特征摘要】
1.一种基于传播路径间与传播路径内影响力建模的信息传播预测方法,其特征在于,包括以下步骤:步骤一、获取历史信息传播数据集;步骤二、根据历史信息传播数据集训练基于图卷积时空耦合神经网络的信息传播预测模型;步骤三、将待预测信息数据输入训练好的信息传播预测模型中,获取待预测信息数据的信息传播预测结果。2.根据权利要求1所述的一种基于传播路径间与传播路径内影响力建模的信息传播预测方法,其特征在于,步骤二中所述基于图卷积时空耦合神经网络的信息传播预测模型构建如下:1)深度图嵌入表示:利用图卷积神经网络模型表示信息传播级联图中的每个节点,获得聚合邻居节点信息的节点表示即图嵌入表示P
g
;2)Deepwalk级联序列采样:利用深度游走算法对信息传播级联图进行采样,得到K条长度为N的级联传播路径序列,经过深度游走算法的训练获得每个节点的特征表示即序列嵌入表示P
w
;将图嵌入表示P
g
与序列嵌入表示P
w
进行拼接以对节点的表示进行更新;3)信息传播级联图结构因素建模:将表示更新后的节点序列分别输入双向长短时记忆模型中,得到信息传播级联图的结构特征表示A;4)信息传播级联图时序因素建模:使用门控循环单元模型提取时序特征表示M,通过注意力机制,时序信息指导下赋予不同的级联序列不同的权重,获得融合时序因素与结构因素的信息传播级联图的最终表示O。3.根据权利要求2所述的一种基于传播路径间与传播路径内影响力建模的信息传播预测方法,其特征在于,所述深度图嵌入表示中获得聚合邻居节点信息的节点表示即图嵌入表示P
g
的具体过程包括:对于信息传播级联图中的任意节点v在m+1层的表示,消息传播的聚合函数表示为:式中,AGG表示消息传播的聚合函数;为第m层的节点特征表示;N(v)表示节点v的邻居节点集合;w表示一个可训练的权重矩阵;b表示偏差修正向量;更新函数表示为:式中,σ表示sigmod非线性激活函数;表示节点v在第m层的特征表示;用矩阵的方式来表示图神经网络节点间的传播与更新:其中,H表示节点的嵌入表示;表示邻接矩阵,表示节点之间的相互连接关系,
为单位矩阵;D是一个对角阵,为矩阵A的度矩阵;w表示一个可训练的权重矩阵;b表示偏差修正向量;每个节点的特征向量表示为4.根据权利要求3所述的一种基于传播路径间与传播路径内影响力建模的信息传播预测方法,其特征在于,所述Deepwalk级联序列采样中对信息传播级联图进行采样,获得每个节点的特征表示即序列嵌入表示P
w
的具体过程包括:采样K条长度为N的级联序列的过程为:根据下述公式确定路径的起始点:其中,deg
i
(v)表示节点v在信息传播级联图中出度的大小;α为平滑量;deg
i
(w)表示节点w在信息传播级联图中出度的大小,V
c
表示节点w的邻居节点集合;确定起始节点v后,在信息传播级联图中其出度邻居结点的集合为N
i
(v),则其前往下一个出度邻居由下述公式确定:当邻居节点的采样长度达到设定值N,或者没有下一个邻居结点时,当前采样序列结束;当序列的数目达到设定值K时,随机游走采样结束,得到K条信息传播级联图的传播路径;基于自然语言处理领域中的Word2Vector模型,视每个节点为单个的单词,每条传播路径视为一个句子;级联序列中的每个节点被表示为一个独热向量其中|U
i
|表示信息传播级联图中节点的总数;通过一个嵌入矩阵将每个节点转换成一个低维稠密向量y,将向量y输入Skip

gram模型中,经过训练学习得到节点的嵌入表示P
w
。5.根据权利要求4所述的一种基于传播路径间与传播路径内影响力建模的信息传播预测方法,其特征在于,所述信息传播级联图结构因素建模中将表示更新后的节点序列分别输入双向长短时记忆模型中得到信息传播...

【专利技术属性】
技术研发人员:何慧邰煜杨洪伟张伟哲武兴隆
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1