一种基于图神经网络的舆情流行度预测方法及系统技术方案

技术编号:33307297 阅读:24 留言:0更新日期:2022-05-06 12:17
本发明专利技术公开了一种基于图神经网络的舆情流行度预测方法及系统,包括以下步骤,首先定义流行度,建立信息级联图与流行度之间的关系模型;基于关系模型级联图特征,获取级联图特征;基于关系模型级联图特征,获取时间序列特征;基于时间序列特征,得到每个时间间隔的情感值,生成情感序列特征;将级联图特征、时间序列特征和情感序列特征连接,计算得到未来流行度。本发明专利技术可以有效预测舆情事件的流行度。有助于对社会事件的管理,减少经济损失,解决了现有技术中级联图表示效率低下,预测的准确率不理想的技术问题。不理想的技术问题。不理想的技术问题。

【技术实现步骤摘要】
一种基于图神经网络的舆情流行度预测方法及系统


[0001]本专利技术属于网络信息安全
,涉及一种基于图神经网络的舆情流行度预测方法及系统。

技术介绍

[0002]随着互联网的快速发展,以网络社交平台为代表的新型媒体,已成为网络舆情传播和发酵的重要平台,并且信息的数量也以前所未有的速度在快速膨胀,这使得社会事件在网络上的传播更加快速和广泛。为了更好的管理社交网络中的时间,提高对网络时间的治理水平,对事件的传播分析是至关重要的。流行度预测是事件传播分析中的研究重点,有效预测在线内容的流行度对于网络事件的治理和管控是十分重要的。
[0003]传统的流行度预测方法主要包括基于特征的方法和生成方法。基于特征的方法包括内容特征、结构特征、时间特征等,并使用机器学习算法进行预测。但是基于特征的方法需要大量的特征工程,性能在很大程度上取决于提取特征的有效性。生成方法致力于通过概率统计生成方法对扩散过程进行建模,例如流行模型和点过程,但性能通常受到其对潜在扩散机制的强假设的限制。
[0004]随着深度学习的快速发展以及在许多领域的成功应用,许多研究人员将其应用于社交网络。DeepCas是一种端到端的深度学习方法,它利用随机游走方法在全局图结构的上下文中从级联图中采样路径,它还使用注意力机制将级联路径嵌入集成到级联图嵌入中,用于级联尺寸预测任务。DeepHawkes在将级联路径嵌入集成到级联嵌入中时,通过考虑时间衰减效应来提高流行度预测的性能。近年来,研究人员侧重于使用图神经网络学习级联图特征,然而这些基于图神经网络的方法中的级联图表示通常由简单的图池化策略生成,无法区分用户的重要性并导致级联图表示效率低下。并且目前的研究中很少有方法将情感因素加入其中,导致预测的准确率不理想。

技术实现思路

[0005]本专利技术的目的在于解决现有技术中的问题,提供一种基于图神经网络的舆情流行度预测方法及系统。
[0006]为达到上述目的,本专利技术采用以下技术方案予以实现:
[0007]一种基于图神经网络的舆情流行度预测方法,包括以下步骤:
[0008]S1:建立信息级联图与流行度之间的关系模型;
[0009]S2:基于关系模型,通过图神经网络GraphSage获取级联图特征;
[0010]S3:通过LSTM神经网络,获取时间序列特征;
[0011]S4:基于时间序列特征,得到每个时间间隔的情感值,生成情感序列特征;
[0012]S5:将级联图特征、时间序列特征和情感序列特征连接,计算得到未来流行度。
[0013]本专利技术的进一步改进在于:
[0014]所述S1包括以下步骤:
[0015]将一条推文c
i
在时间t0的级联图表示为:
[0016][0017]其中:表示参与级联的用户集,表示用户之间的交互关系;
[0018]建立用户参与级联时的时间关系:
[0019][0020]其中,表示在时间t0时参与级联的用户数量;
[0021]建立用户参与级联的情感关系:
[0022][0023]基于公式(1)、(2)和(3)预测在固定时间间隔Δt后的增量流行度P
i

[0024][0025]所述S2包括以下步骤:
[0026]S2.1:基于公式(1),利用图神经网络GraphSage作为图卷积层来学习每个节点的标识,所述公式(1)中每个节点v最初表示为一个one

hot向量其中N是是数据集中用户总数,进一步基于嵌入矩阵E∈R
D
×
N
:将所有节点转化为低维矩阵:
[0027][0028]其中,D的维度可以调节;
[0029]S2.2:对GraphSage的节点嵌入进行学习,采用最大池化聚合策略:
[0030][0031]其中,N(v)表示节点v的邻域集,表示节点μ在第k

1个图卷积步骤的嵌入;和表示神经网络的能够学习参数;σ表示sigmoid函数;
[0032]获取完整的邻域集后,更新节点嵌入
[0033][0034]其中,Concat表示嵌入串联;W
k
表示用于更新第k个卷积层中的节点嵌入的重矩阵;
[0035]S2.3:引入能够学习向量计算跨节点集的重要性系数:
[0036][0037]基于公式(8)从级联图汇总选择排名靠前的节点,通过预定义的下采样率γ丢弃
系数低的节点,定义诱导子图为将重要性系数作为用户权重,并对诱导子图做全局最大池化以生成级联图特征
[0038][0039]所述S3包括以下步骤:
[0040]基于LSTM神经网络获取时间序列特征,在公式(2)中,提取每条推文相互感染的持续时间其中x
i
=t
i

t
i
‑1,将该时间输入LSTM中,在每次循环计算后获取一系列输出
[0041][0042]其中,表示标量值,表示前一时间步的隐藏状态,max表示所有级联的最大时间步,并且d表示隐藏状态的维度;
[0043]进一步使用由{n*10
m
,n∈{1,2,...10},m=0,1,2}生成的索引序列对输出序列进行采样,并使用加权和从LSTM的输出中获得时间序列特征:
[0044][0045]其中,N表示样本大小,表示训练期间自动学习的注意力向量。
[0046]所述S4包括以下步骤:
[0047]计算文本的情感概率分布y
d
,基于y
d
得到文本的情感倾向EO:
[0048][0049]所述S5包括以下步骤:
[0050]将S2、S3和S4得到的级联图特征、时间序列特征和情感序列特征输入到MLP中,得到未来流行度:
[0051][0052]使用均方对数变换误差MSLE作为损失函数:
[0053][0054]其中,N表示级联总数;表示预测的增量流行度;P
i
表示级联C
i
的实际增量流行度。
[0055]一种基于图神经网络的舆情流行度预测系统,包括流行度模块、级联图特征模块、
时间序列特征模块、情感序列特征模块和未来流行度模块;
[0056]流行度模块,建立信息级联图与流行度之间的关系模型;;
[0057]级联图特征模块,用于基于关系模型,通过图神经网络GraphSage获取级联图特征;
[0058]时间序列特征模块,用于通过LSTM神经网络,获取时间序列特征;
[0059]情感序列特征模块,用于基于时间序列特征,得到每个时间间隔的情感值,生成情感序列特征;
[0060]未来流行度模块,用于将级联图特征、时间序列特征和情感序列特征连接,计算得到未来流行度。
[0061]一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图神经网络的舆情流行度预测方法,其特征在于,包括以下步骤:S1:建立信息级联图与流行度之间的关系模型;S2:基于关系模型,通过图神经网络GraphSage获取级联图特征;S3:通过LSTM神经网络,获取时间序列特征;S4:基于时间序列特征,得到每个时间间隔的情感值,生成情感序列特征;S5:将级联图特征、时间序列特征和情感序列特征连接,计算得到未来流行度。2.根据权利要求1所述的一种基于图神经网络的舆情流行度预测方法,其特征在于,所述S1包括以下步骤:将一条推文c
i
在时间t0的级联图表示为:其中:表示参与级联的用户集,表示用户之间的交互关系;建立用户参与级联时的时间关系:其中,表示在时间t0时参与级联的用户数量;建立用户参与级联的情感关系:基于公式(1)、(2)和(3)预测在固定时间间隔Δt后的增量流行度P
i
:3.根据权利要求2所述的一种基于图神经网络的舆情流行度预测方法,其特征在于,所述S2包括以下步骤:S2.1:基于公式(1),利用图神经网络GraphSage作为图卷积层来学习每个节点的标识,所述公式(1)中每个节点v最初表示为一个one

hot向量其中N是是数据集中用户总数,进一步基于嵌入矩阵E∈R
D
×
N
:将所有节点转化为低维矩阵:其中,D的维度可以调节;S2.2:对GraphSage的节点嵌入进行学习,采用最大池化聚合策略:其中,N(v)表示节点v的邻域集,表示节点μ在第k

1个图卷积步骤的嵌入;和表示神经网络的能够学习参数;σ表示sigmoid函数;获取完整的邻域集后,更新节点嵌入
其中,Concat表示嵌入串联;W
k
表示用于更新第k个卷积层中的节点嵌入的重矩阵;S2.3:引入能够学习向量计算跨节点集的重要性系数:基于公式(8)从级联图汇总选择排名靠前的节点,通过预定义的下采样率γ丢弃系数低的节点,定义诱导子图为将重要性系数作为用户权重,并对诱导子图做全局最大池化以生成级联图特征化以生成级联图特征4.根据权利要求3所述的一种基于图神经网络的舆情流行度预测方法,其特征在于,所述S3包括以下步骤:基于LSTM神经网络获取时间序列特征,在公式(2)中,提取每条推文相互感染的持续时间其中x...

【专利技术属性】
技术研发人员:徐亦飞张屿琪朱利尉萍萍曹帅张美丹程菊飞
申请(专利权)人:西安交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1