一种面向社交网络的热点事件预测方法技术

技术编号：31487126 阅读：11 留言：0更新日期：2021-12-18 12:22

本发明专利技术属于热点事件预测技术领域，具体提供一种面向社交网络的热点事件预测方法，用以解决现有技术中文本数据价值挖掘不够、动态时序特征与上下文语义信息利用不充分等技术问题。本发明专利技术首先，基于图卷积神经网络捕捉文本邻域语义信息，能够充分挖掘关键词语之间的依存关系；其次，提出维度注意力机制，改进图神经网络的动态分层传播方式，通过维度注意力机制生成重点特征摘要，并将其用于缩放原特征，自适应地调整各个维度特征响应值，增加事件预测中有价值词语的权重，同时抑制价值较弱词语的权重，即充分捕捉社交网络文本时变信息；最终，基于关键词语邻域信息与时序信息充分挖掘文本数据价值，提高模型预测的准确率，具有实用价值。价值。价值。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向社交网络的热点事件预测方法

[0001]本专利技术属于热点事件预测
，涉及图神经网络在热点事件预测技术中的应用，具体提供一种面向社交网络数据的基于动态图神经网络的热点事件预测方法。

技术介绍

[0002]如今，社交网络已经逐渐渗入人们生活各个方面，包括社会、政治和经济等；社交网络开放性强、信息传播迅速，吸引了海量用户，成为公众发布社会消息、讨论现实事件的重要渠道；社交网络事件通常是现实事件在网络空间的映射，大量研究人员展开面向社交网络的热点事件预测研究。有学者从数学上将热点事件预测问题定义为预测一个可观测的事件在未来是否会成为热点，目前研究面向社交网络的热点事件预测任务主要包含以下三类：预测网络事件是否成为热点、预测事件在某个时间热度值、预测事件变热的概率，根据预测方法的不同将其分为基于传统机器学习和基于深度学习两种方法。
[0003]Suh等人针对单条推文流行度预测问题，基于用户信息、文本内容，利用主成分分析(PCA)与广义线性模型(GLM)寻找早期特征与转发数量之间的关系。Zhang等人则选择事件相关文本，用户兴趣、影响力以及历史流行度实现流行度线性函数建模，解决事件下一时刻流行度预测问题。目前现有研究事件预测问题大多围绕用户属性、级联关系等特征，较少研究考虑利用文本信息对热度变化进行建模。Geng等人提出一种基于推特数据的时空事件预测生成模型，该模型通过对结构背景和时空突发性联合建模，刻画未来事件的潜在发展。Deng等人提出的动态图卷积神经网络(DGCN)利用事件上下文，以动态图结构形式对

【技术保护点】

【技术特征摘要】
1.一种面向社交网络的热点事件预测方法，包括以下步骤：步骤1、对源数据进行数据预处理得到文本数据，并对每条文本数据进行0、1分类标记，获得样本数据；步骤2、根据预定时序将样本数据构建为带有节点特征的时序图结构数据，利用图卷积神经网络对时序图结构数据进行处理，通过图卷积模块进行卷积操作，获得聚合关键词语邻域信息的文本特征向量；步骤3、通过维度注意力机制对步骤2所得文本特征向量进行编码，捕捉其时序相关性，获得聚合关键词语邻域信息与时序信息的文本特征向量；步骤4、对步骤3所得文本特征向量进行可学习的线性变换，获得最终文本特征向量，并利用分类器进行分类预测计算，获得预测结果。2.按权利要求1所述面向社交网络的热点事件预测方法，其特征在于，所述步骤1具体包括如下步骤：步骤1.1、对源数据集进行随机采样，再对采样后数据依次进行事件合并、噪声清洗、时序切分预处理，再利用jieba工具对文本进行分词处理，再利用TF
‑
IDF方法对关键词语进行提取过滤，再利用GloVe算法对关键词语进行预训练、生成关键词语的初始特征向量，得到文本数据；步骤1.2、将预测问题定义为事件是否变为热点的二分类任务，根据设定的事件转发量阈值对文本数据进行标签标记，类别标签包括0和1，获得具有标签的样本数据。3.按权利要求1所述面向社交网络的热点事件预测方法，其特征在于，所述步骤2具体包括如下步骤：步骤2.1、设置时序k
t
，k
t
∈[1,T]，T为时序切分的总数；步骤2.2、根据点互信息(PMI)算法，计算关键词语之间的相互依存关系：其中，D
t
为时序内文本集合总数，d
t
(i,j)为在时序内关键词语i与关键词语j同时出现的文本总数，d
t
(i)与d
t
(j)分别为在时序内关键词语i与关键词语j至少出现一次的文本总数；将关键...

【专利技术属性】
技术研发人员：田玲，许毅，惠孛，张栗粽，罗光春，冀柯曦，樊美琦，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人