【技术实现步骤摘要】
一种用于社交媒体上的谣言检测方法
[0001]本专利技术属于社交媒体上的谣言检测
,更为具体地讲,涉及一种用于社交媒体上的谣言检测方法。
技术介绍
[0002]谣言检测(RumorDetection)的主要任务是根据社交媒体上发布的消息,以及这些消息下的大量转发或回复形成的传播,进行判断其原始消息是否为谣言。因此消息的传播结构,时间轴,以及文本内容对于判断至关重要。现有的方法要么只采用时间轴,而忽略传播结构;要么只采用传播结构,而忽略时间轴;将二者融合的方法中,也只是将传播结构和时间轴以嵌入的方式叠加入文本特征中,而忽视了传播结构的动态性。
[0003]社交媒体上的谣言检测(RumorDetection),其主要目标是根据社交媒体上发布的消息,以及这些消息下的大量转发或回复形成的传播,进行判断其原始消息是否为谣言。经典的方法分为三类:1)将原始消息与回复/转发按发布的时间先后排序,然后排序后的序列分成多段,用词频
‑
逆文本频率指数值(tf
‑
idf)表示每个时间段,最后用循环神经网络(RNN)得到整个序列的表示,以此作为该原始消息传播的表示,进行分类;2)将消息在社交媒体上的传播过程绘制成传播树结构,每个节点表示用户针对原始消息发布的评论,通过递归地提取整个传播树的表示以进行分类;3)对用户发布消息的时间以及其在传播树上的相对位置进行编号,采用嵌入(embedding)的方式,得到用户评论的时间表示以及结构表示,再将其叠加入模型的计算中去,以做到时间信息,文本信息以及 ...
【技术保护点】
【技术特征摘要】
1.一种用于社交媒体上的谣言检测方法,其特征在于,包括以下步骤:(1)、利用待验证的话题构建传播树;将待验证的话题作为传播树的根节点,对话题的直接评论作为一阶子节点,对话题的评论的评论作为二阶子节点,然后以此类推,从而构建出传播树;(2)、分话题;将传播树按其一阶子节点拆分为多个子话题,每个子话题也是一个传播树,然后将待验证话题添加到每一个传播树中,作为每一个传播树的根节点,从而构建出多个子话题传播树;(3)、利用动态图神经网络以节点流的方式更新各个子话题传播树;(3.1)、将每一个子话题中的节点视为一个文字序列,记为s
i
={w1,w2,
…
,w
l
,
…
,w
L
},w
l
表示第i个节点中第l个单词,L表示单词总数量;(3.2)、利用动态图神经网络中的初始化单元将文字序列s
i
初始化为文本特征矩阵,记为S
i
,S
i
的维度大小为L
×
d,d为单词对应的词向量维度;(3.3)、利用动态图图神神经网络中的Transformer单元将文本特征矩阵S
i
映射为特征向量;利用Transformer的n头注意力层将文本特征矩阵S
i
先映射为查询矩阵键矩阵和值矩阵V
ij
;其中,j∈[1,n]表示第j个注意力头,为第j个注意力头的权值矩阵,其维度大小均为然后通过注意力机制提取各个注意力头的交互信息然后通过注意力机制提取各个注意力头的交互信息其中,表示第j个注意力头的维度,上标T表示转置;最后将各个注意力头间的交互信息连接起来再通过前向反馈网络得到第i个节点的特征矩阵然后通过最大池化层从中提取显著信息,从而获得第i个节点的特征向量其维度大小为1
×
d;(3.4)、利用动态图神经网络中的更新单元更新特征向量(3.4.1)、设置元数据包含四个部分:父节点部分、子节点部分、节点表示和更新时间;(3.4.2)、将特征向量更新为元数据其中,表示节点i作为父节点时的特征信息;为映射矩阵,用于将特征向量映射到父节点空间;表示节点i作为子节点时的特征信息;
为映射矩阵,用于将特征向量映射到子节点空间;表示节点i的节点表示;为权值矩阵;t
i
为更新时间,初始化为节点i出现的时间,即节点i所代表的评论信息发布的时间;(3.4.3)、根据评论关系在子传播树中搜索节点i的父节点,记为post
p
,并得到父节点的元数据(3.4.4)、将节点i与其父节点post
p
的节点表示进行融合,得到此时的上下文表示:其中,ReLU(
·
)为非线性激活函数,u
p
是父节点post
p
的当前节点表示,u
i
是子节点i的当前节点表示,和分别代表父节点和子节点的权重;(3.4.5)、利用对时间敏感的长短期记忆网络Time
‑
ware LSTM将此时的上下文表示e更新入节点i及其父节点post
p
的节点表示中;将e以及时间间隔Δt=t
i
‑
t
p
输入至Time
‑
ware LSTM,更新节点i的父节点post
p
的元数据:的元数据:其中,表示父节点post
p
更新后的元数据中其作为父节点的特征信息,为权值矩阵,u
p
(new)表示更新后的父节点post
p
的节点表示;将e以及时间间隔Δt=0输入至Time
‑
ware LSTM,更新节点i的元数据:LSTM,更新节点i的元数据:其中,表示节点i更新后的元数据中其作为子节点的特征信息,表示权值矩阵,u
i
(new)表示更新后的节点i的节点表示;更新完成后,节点i的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。