【技术实现步骤摘要】
基于动态信息传播演化模式的虚假信息检测方法及系统
[0001]本专利技术涉及虚假信息检测方法,特别是涉及一种基于动态信息传播演化模式的虚假信息检测方法及系统。。
技术介绍
[0002]21世纪以来,在线社交网络应运而生并且发展迅猛。社交平台一方面给人们的生活带来了巨大的便利,但另一方面也乱象丛生,平台的信息失序问题不容忽视。在信息时代下,如何快速有效地检测出社交网络中的虚假信息并进行及时的干预处理对于网络空间的舆情治理有其不可替代的社会意义。
[0003]在研究领域内,社交网络中的虚假信息检测问题按照其不同的侧重对象进行分类,主要可以分为早期关注原推文静态信息的检测方法、关注信息传播上下文的检测方法以及关注事件共享特征的检测方法。早期关注原推文静态特征的方法,其研究对象局限于原推文及其发布者本身,其特征设计过程依赖人工规则,难以挖掘复杂的抽象特征,精力消耗较大。而关注推文传播上下文的方法在关注原推文的基础上,增加考量了原推文的转发推文,并根据推文之间的关系派生了两种形式的上下文环境。一种是根据时间顺序组织的时序上下文环境,一种是根据推文在社交平台上的转发、评论等关系组织的交互上下文环境。在时序上下文中,原创推文及其转发推文被按照时间顺序进行排列,以时序关系为依托进行语义融合。在交互上下文中,推文按照其转发、评论关系被建模为以原创推文为根节点的树结构,称之为传播树。传播树真实还原了传播过程中转发,评论所产生的交互关系,以此为基础,这类模型在推文层面实现了依托于实际交互关系的信息融合。另外,还有一部分研究者关注的 ...
【技术保护点】
【技术特征摘要】
1.一种基于动态信息传播演化模式的虚假信息检测方法,该方法包括以下步骤:(1)文本特征嵌入根据数据集提供的句子中各个单词的表示,通过双向RNN网络和注意力机制进行特征提取和聚合,得到数据集中各个句子的向量表示;(2)信息传播过程的多阶段划分根据推文传播上下文中所包含的推文的最长时间跨度,以及各推文在时间维度上的分布情况,选择时间阈值Δt对推文传播的上下文环境进行阶段性的划分,从而得到处于不同时间阶段的推文传播的上下文环境;(3)推文多阶段传播上下文建模根据步骤(2)划分得到的处于不同时间阶段的推文传播的上下文环境,对于各时间阶段的推文的传播上下文环境,分别从时间和交互关系两个角度去考虑,使用时序模型得到时间上下文环境下的阶段信息的表示,使用图注意力模型得到交互关系上下文环境下的阶段信息的表示,之后对两者进行拼接,得到在时间和交互关系两种上下文环境下的阶段信息的整体表示;(4)推文传播的动态演化模式分析与表示将步骤(3)得到的在时间和交互关系两种上下文环境下的阶段信息的整体表示按照其时序关系组织为序列型数据,使用RNN模型对该序列型数据进行建模分析,得到具有阶段上下文环境的各时间阶段的信息表示,并通过平均池化对具有阶段上下文环境的各时间阶段的信息表示进行融合得到推文传播信息的整体表示;(5)虚假信息检测通过步骤(4)得到推文传播信息的整体表示,训练多层感知机网络,构建虚假信息检测模型,进行虚假信息的检测;(6)系统功能展示。2.根据权利要求1所述的基于动态信息传播演化模式的虚假信息检测方法,其特征在于,步骤(1)所述的文本特征嵌入的具体过程为:根据信息传播过程中的各个推文的初始表示X={x0,x1,
…
,x
N
},x
i
=[x
i,1
,x
i,2
,
…
,x
i,n
],其中,x
i
表示第i条推文,N表示数据集中共有N条推文,x
i,j
表示第i条推文的第j个单词,n表示句子中单词的个数;使用双向RNN模型进行单词之间依赖关系的学习,分别得到各个单词在正序和逆序方向上RNN隐藏层的状态表示,将推文i中第j个单词在正序和逆序上分别被表示为对两者进行拼接得到经过RNN模型编码后的第j个单词表示h
i,j
;使用注意力机制进行加权求和即可得到推文i的文本嵌入表示z
i
,最后学习得到推文事件中各推文的初始向量表示为Z={z0,z1,
…
,z
N
}。3.根据权利要求1所述的基于动态信息传播演化模式的虚假信息检测方法,其特征在于,步骤(2)中所述的信息传播过程的多阶段划分的具体过程为:对于每一个给定的推文事件Ev={Z,G,T},其中,Z={z0,z1,
…
,z
N
}为推文事件中各推文的初始向量表示;G=(V,E)为推文事件中各推文的传播树,其中,V表示推文传播树中所包含的原创推文及转发推文节点的集合,E表示原创推文及转发推文之间的交互关系,包括转发、评论所代表的边的集合;T={t0,t1,
…
,t
N
}为推文事件中各推文的发布时间;根据设
置的时间阈值Δt对信息的传播过程进行多阶段划分,得到时间段的传播上下文,其中:时间段的传播上下文,其中:时间段的传播上下文由原推文以及发布时间小于时间段的转发或评论推文构成;划分之后,对于推文事件Ev,其在时间段的传播上下文表示为所包含的推文传播树由表示,推文传播树中包含的交互关系为表示,推文传播树中包含的交互关系为该时间段的各个推文的初始向量表示为各个推文的发布时间分布为推文M的发布时间小于在时间段的传播上下文表示为时间段的传播上下文表示为按照时间阈值Δt,整个推文事件可划分为Q个阶段:其中,t0表示原创推文...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。