一种基于传播路径间与传播路径内影响力建模的信息传播预测方法及系统技术方案

技术编号：36526299 阅读：10 留言：0更新日期：2023-02-01 16:05

一种基于传播路径间与传播路径内影响力建模的信息传播预测方法及系统，涉及信息传播预测技术领域，用以解决在一段时间之后信息在社交网络中流行度增长量的预测问题。本发明专利技术的技术要点包括：使用图神经网络对级联图进行建模，得到聚合邻居节点状态与特征的节点表示；通过深度游走算法对整体级联网络图进行采样，获得级联图的序列集合，将图形神经网络嵌入表示与Deepwalk嵌入表示进行拼接来更新序列中各个节点的信息；将附有邻居信息的节点表示序列输入双向LSTM中，同时将时序信息经过注意力机制引导对序列进行整合，增强了级联预测模型的理解能力与预测能力。本发明专利技术兼顾级联传播路径间与传播路径内影响力传递性，以及纳入时序与结构因素互补性的有效性。与结构因素互补性的有效性。与结构因素互补性的有效性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于传播路径间与传播路径内影响力建模的信息传播预测方法及系统

[0001]本专利技术涉及信息传播预测
，具体涉及一种基于传播路径间与传播路径内影响力建模的信息传播预测方法及系统。

技术介绍

[0002]随着互联网和移动设备功能的增强，用户日益增长，在线社会网络平台成为用户发表意见、表达思想的重要途径，极大的促进了信息的产生和传播。面对如此鱼目混杂的信息，不仅为平台的管理者带来管理失控的威胁，也会对广大用户造成信息过载的困扰。做好在线网络中的信息传播预测，可以提前从海量的信息中预测并筛选出来未来的爆发式热门消息，从而为平台管理者提供科学的管理指导，也为用户筛选信息起到很好的过滤作用。然而，网络中用户的相互关注与转发行为，促成了信息级联现象
‑
当前用户的信息传播行为会带动与其相关联的其他用户的信息传播行为，这种级联效应以及平台的开放性，为信息传播预测带来一定的挑战。
[0003]信息传播预测从研究方法上一般分为三类。(1)基于特征的方法，在观测时间窗口内，提取一些特征，比如内容特征，用户特征，结构特征，时序特征，通过未来的流行度，直接做监督信息来进行学习，然而特征的提取有很强的人为主观因素，且不具有普适性。(2)生成式方法，主要把现实网络中社会现象描述成一系列连续时间域中的事件序列，将信息的传播积累看成是一个转发行为的到达过程，主要侧重于对每条信息转发过程中的速率函数独立建模。代表性工作主要有增强泊松过程，以及霍克斯点过程，这些模型不受未来的预测信息监督，预

【技术保护点】

【技术特征摘要】
1.一种基于传播路径间与传播路径内影响力建模的信息传播预测方法，其特征在于，包括以下步骤：步骤一、获取历史信息传播数据集；步骤二、根据历史信息传播数据集训练基于图卷积时空耦合神经网络的信息传播预测模型；步骤三、将待预测信息数据输入训练好的信息传播预测模型中，获取待预测信息数据的信息传播预测结果。2.根据权利要求1所述的一种基于传播路径间与传播路径内影响力建模的信息传播预测方法，其特征在于，步骤二中所述基于图卷积时空耦合神经网络的信息传播预测模型构建如下：1)深度图嵌入表示：利用图卷积神经网络模型表示信息传播级联图中的每个节点，获得聚合邻居节点信息的节点表示即图嵌入表示P
g
；2)Deepwalk级联序列采样：利用深度游走算法对信息传播级联图进行采样，得到K条长度为N的级联传播路径序列，经过深度游走算法的训练获得每个节点的特征表示即序列嵌入表示P
w
；将图嵌入表示P
g
与序列嵌入表示P
w
进行拼接以对节点的表示进行更新；3)信息传播级联图结构因素建模：将表示更新后的节点序列分别输入双向长短时记忆模型中，得到信息传播级联图的结构特征表示A；4)信息传播级联图时序因素建模：使用门控循环单元模型提取时序特征表示M，通过注意力机制，时序信息指导下赋予不同的级联序列不同的权重，获得融合时序因素与结构因素的信息传播级联图的最终表示O。3.根据权利要求2所述的一种基于传播路径间与传播路径内影响力建模的信息传播预测方法，其特征在于，所述深度图嵌入表示中获得聚合邻居节点信息的节点表示即图嵌入表示P
g
的具体过程包括：对于信息传播级联图中的任意节点v在m+1层的表示，消息传播的聚合函数表示为：式中，AGG表示消息传播的聚合函数；为第m层的节点特征表示；N(v)表示节点v的邻居节点集合；w表示一个可训练的权重矩阵；b表示偏差修正向量；更新函数表示为：式中，σ表示sigmod非线性激活函数；表示节点v在第m层的特征表示；用矩阵的方式来表示图神经网络节点间的传播与更新：其中，H表示节点的嵌入表示；表示邻接矩阵，表示节点之间的相互连接关系，
为单位矩阵；D是一个对角阵，为矩阵A的度矩阵；w表示一个可训练的权重矩阵；b表示偏差修正向量；每个节点的特征向量表示为4.根据权利要求3所述的一种基于传播路径间与传播路径内影响力建模的信息传播预测方法，其特征在于，所述Deepwalk级联序列采样中对信息传播级联图进行采样，获得每个节点的特征表示即序列嵌入表示P
w
的具体过程包括：采样K条长度为N的级联序列的过程为：根据下述公式确定路径的起始点：其中，deg
i
(v)表示节点v在信息传播级联图中出度的大小；α为平滑量；deg
i
(w)表示节点w在信息传播级联图中出度的大小，V
c
表示节点w的邻居节点集合；确定起始节点v后，在信息传播级联图中其出度邻居结点的集合为N
i
(v)，则其前往下一个出度邻居由下述公式确定：当邻居节点的采样长度达到设定值N，或者没有下一个邻居结点时，当前采样序列结束；当序列的数目达到设定值K时，随机游走采样结束，得到K条信息传播级联图的传播路径；基于自然语言处理领域中的Word2Vector模型，视每个节点为单个的单词，每条传播路径视为一个句子；级联序列中的每个节点被表示为一个独热向量其中|U
i
|表示信息传播级联图中节点的总数；通过一个嵌入矩阵将每个节点转换成一个低维稠密向量y，将向量y输入Skip
‑
gram模型中，经过训练学习得到节点的嵌入表示P
w
。5.根据权利要求4所述的一种基于传播路径间与传播路径内影响力建模的信息传播预测方法，其特征在于，所述信息传播级联图结构因素建模中将表示更新后的节点序列分别输入双向长短时记忆模型中得到信息传播...

【专利技术属性】
技术研发人员：何慧，邰煜，杨洪伟，张伟哲，武兴隆，
申请(专利权)人：哈尔滨工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人