【技术实现步骤摘要】
一种基于图神经网络的舆情流行度预测方法及系统
[0001]本专利技术属于网络信息安全
,涉及一种基于图神经网络的舆情流行度预测方法及系统。
技术介绍
[0002]随着互联网的快速发展,以网络社交平台为代表的新型媒体,已成为网络舆情传播和发酵的重要平台,并且信息的数量也以前所未有的速度在快速膨胀,这使得社会事件在网络上的传播更加快速和广泛。为了更好的管理社交网络中的时间,提高对网络时间的治理水平,对事件的传播分析是至关重要的。流行度预测是事件传播分析中的研究重点,有效预测在线内容的流行度对于网络事件的治理和管控是十分重要的。
[0003]传统的流行度预测方法主要包括基于特征的方法和生成方法。基于特征的方法包括内容特征、结构特征、时间特征等,并使用机器学习算法进行预测。但是基于特征的方法需要大量的特征工程,性能在很大程度上取决于提取特征的有效性。生成方法致力于通过概率统计生成方法对扩散过程进行建模,例如流行模型和点过程,但性能通常受到其对潜在扩散机制的强假设的限制。
[0004]随着深度学习的快速发展以及在许多领域的成功应用,许多研究人员将其应用于社交网络。DeepCas是一种端到端的深度学习方法,它利用随机游走方法在全局图结构的上下文中从级联图中采样路径,它还使用注意力机制将级联路径嵌入集成到级联图嵌入中,用于级联尺寸预测任务。DeepHawkes在将级联路径嵌入集成到级联嵌入中时,通过考虑时间衰减效应来提高流行度预测的性能。近年来,研究人员侧重于使用图神经网络学习级联图特征,然而这些基于图神经网 ...
【技术保护点】
【技术特征摘要】
1.一种基于图神经网络的舆情流行度预测方法,其特征在于,包括以下步骤:S1:建立信息级联图与流行度之间的关系模型;S2:基于关系模型,通过图神经网络GraphSage获取级联图特征;S3:通过LSTM神经网络,获取时间序列特征;S4:基于时间序列特征,得到每个时间间隔的情感值,生成情感序列特征;S5:将级联图特征、时间序列特征和情感序列特征连接,计算得到未来流行度。2.根据权利要求1所述的一种基于图神经网络的舆情流行度预测方法,其特征在于,所述S1包括以下步骤:将一条推文c
i
在时间t0的级联图表示为:其中:表示参与级联的用户集,表示用户之间的交互关系;建立用户参与级联时的时间关系:其中,表示在时间t0时参与级联的用户数量;建立用户参与级联的情感关系:基于公式(1)、(2)和(3)预测在固定时间间隔Δt后的增量流行度P
i
:3.根据权利要求2所述的一种基于图神经网络的舆情流行度预测方法,其特征在于,所述S2包括以下步骤:S2.1:基于公式(1),利用图神经网络GraphSage作为图卷积层来学习每个节点的标识,所述公式(1)中每个节点v最初表示为一个one
‑
hot向量其中N是是数据集中用户总数,进一步基于嵌入矩阵E∈R
D
×
N
:将所有节点转化为低维矩阵:其中,D的维度可以调节;S2.2:对GraphSage的节点嵌入进行学习,采用最大池化聚合策略:其中,N(v)表示节点v的邻域集,表示节点μ在第k
‑
1个图卷积步骤的嵌入;和表示神经网络的能够学习参数;σ表示sigmoid函数;获取完整的邻域集后,更新节点嵌入
其中,Concat表示嵌入串联;W
k
表示用于更新第k个卷积层中的节点嵌入的重矩阵;S2.3:引入能够学习向量计算跨节点集的重要性系数:基于公式(8)从级联图汇总选择排名靠前的节点,通过预定义的下采样率γ丢弃系数低的节点,定义诱导子图为将重要性系数作为用户权重,并对诱导子图做全局最大池化以生成级联图特征化以生成级联图特征4.根据权利要求3所述的一种基于图神经网络的舆情流行度预测方法,其特征在于,所述S3包括以下步骤:基于LSTM神经网络获取时间序列特征,在公式(2)中,提取每条推文相互感染的持续时间其中x...
【专利技术属性】
技术研发人员:徐亦飞,张屿琪,朱利,尉萍萍,曹帅,张美丹,程菊飞,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。