当前位置: 首页 > 专利查询>东南大学专利>正文

基于动态信息传播演化模式的虚假信息检测方法及系统技术方案

技术编号:37056581 阅读:15 留言:0更新日期:2023-03-29 19:33
本发明专利技术公开了一种基于动态信息传播演化模式的虚假信息检测方法及系统,本发明专利技术的方法步骤如下:首先利用RNN网络和注意力机制提炼待检测推文的文本特征;基于当前该推文各反馈推文的发布时间对推文的传播过程进行多阶段划分,分别构建多阶段的信息传播树和信息传播序列;基于信息传播树进行交互建模,基于信息传播序列进行时序建模,分别获取信息传播树的交互特征表示和时序特征表示;根据多阶段的信息表示,构建模型,捕捉信息传播的多阶段演化模式,并融合各阶段的信息表示,进行虚假信息检测。本发明专利技术可以及时提供对虚假信息的有效检测,帮助平台或者相关部门有效地进行网络空间的舆论治理。的舆论治理。的舆论治理。

【技术实现步骤摘要】
基于动态信息传播演化模式的虚假信息检测方法及系统


[0001]本专利技术涉及虚假信息检测方法,特别是涉及一种基于动态信息传播演化模式的虚假信息检测方法及系统。。

技术介绍

[0002]21世纪以来,在线社交网络应运而生并且发展迅猛。社交平台一方面给人们的生活带来了巨大的便利,但另一方面也乱象丛生,平台的信息失序问题不容忽视。在信息时代下,如何快速有效地检测出社交网络中的虚假信息并进行及时的干预处理对于网络空间的舆情治理有其不可替代的社会意义。
[0003]在研究领域内,社交网络中的虚假信息检测问题按照其不同的侧重对象进行分类,主要可以分为早期关注原推文静态信息的检测方法、关注信息传播上下文的检测方法以及关注事件共享特征的检测方法。早期关注原推文静态特征的方法,其研究对象局限于原推文及其发布者本身,其特征设计过程依赖人工规则,难以挖掘复杂的抽象特征,精力消耗较大。而关注推文传播上下文的方法在关注原推文的基础上,增加考量了原推文的转发推文,并根据推文之间的关系派生了两种形式的上下文环境。一种是根据时间顺序组织的时序上下文环境,一种是根据推文在社交平台上的转发、评论等关系组织的交互上下文环境。在时序上下文中,原创推文及其转发推文被按照时间顺序进行排列,以时序关系为依托进行语义融合。在交互上下文中,推文按照其转发、评论关系被建模为以原创推文为根节点的树结构,称之为传播树。传播树真实还原了传播过程中转发,评论所产生的交互关系,以此为基础,这类模型在推文层面实现了依托于实际交互关系的信息融合。另外,还有一部分研究者关注的是如何提取虚假信息在不同事件中的共享特征,以提升模型在新的事件环境下的泛化能力。在社会生活中,社交平台上常常会在短时间内爆发新的热点事件,这就要求模型能够提取与事件,话题等无关的特征,以便于处理新的事件中的相关信息。总体来看,目前以传播树为主的虚假信息检测研究仍旧是当前最为前沿的研究方法。
[0004]目前的研究方法对于信息传播过程的建模分析主要在于根据推文之间存在的时序、交互关系建模推文传播过程,缺乏在全局层面对信息传播的动态演化模式进行建模分析。事实上,社会科学方面相关研究表示,根据虚假信息传播过程中的内在逻辑和演变规律,虚假信息通常有相对明显的传播阶段,总体可分为酝酿期、爆发期、蔓延期和平息期。其中,在信息传播的蔓延期,虚假信息往往会因为用户角色的多样性,社交平台的强交互性等外界因素发生变异,引发新的传播。因此,可以认为虚假信息的传播演化是以阶段为单位的,且由于变异机理的存在,信息在传播过程中可能涵盖多个酝酿,爆发和蔓延阶段,最终走向平息,总体来看虚假信息的传播演化过程是复杂多变的。相比之下,正常信息在传播时也会出现形成和终结阶段(分别对应于虚假信息的酝酿期和平息期),但由于正常信息的真实性无可争论,过程中难以出现新的事件需求引发变异。信息传播的持续动力不足,信息传播也会逐渐平息,所以正常信息的传播演化模式通常相对简单。在此基础上,以传播阶段为单位,考虑事件整体的动态演化对虚假信息的检测有至关重要的作用。综合以上研究背景,
本专利技术在整体层面以探索信息的多阶段传播演化为基础,尝试对信息传播的整体过程进行阶段性划分;在阶段内部层面,同时考虑信息的时序传播上下文和交互传播上下文,最后对二者进行结合,提出了基于动态信息传播演化模式的虚假信息检测方法。

技术实现思路

[0005]专利技术目的:为解决现有技术的不足,本专利技术提供一种基于动态信息传播演化模式的虚假信息检测方法及系统。
[0006]技术方案:为实现上述专利技术目的,本专利技术采用以下技术方案:
[0007]本专利技术的一种基于动态信息传播演化模式的虚假信息检测方法,包括以下步骤:
[0008]1、文本特征嵌入
[0009]对于信息传播过程种的各个推文的初始表示X={x0,x1,...,x
N
},x
i
=[x
i,1
,x
i,2


,x
i,n
]。其中,N表示数据集中共有N条推文,x
i,j
表示第i条推文的第j个单词,n表示句子中单词的个数。使用双向RNN模型进行单词之间依赖关系的学习,分别得到各个单词在正序和逆序方向上RNN隐藏层的状态表示,例如推文i中第j个单词在正序和逆序上分别被表示为对两者进行拼接得到经过RNN模型编码后的第j个单词表示h
i,j
。之后,使用注意力机制进行加权求和得到推文i的文本嵌入表示z
i
。最后,各个推文的信息由初始表示X={x0,x1,...,x
N
},学习得到推文事件中各推文的向量表示为Z={z0,z1,...,z
N
}。
[0010]2、信息传播过程的多阶段划分
[0011]对于每一个给定的推文事件Ev={Z,G,T}。其中,Z={z0,z1,...,z
N
}为推文事件中各个推文的向量表示;G=(V,E),G表示由推文节点组成的信息传播树,V表示信息传播树中所包含的原创推文及转发推文节点的集合,E表示原创推文以及转发推文之间的交互关系,包括转发、评论所代表的边的集合;T={t0,t1,...,t
N
}为各个推文的发布时间。根据设置的时间阈值Δt对信息的传播过程进行多阶段划分,其中:
[0012][0013]时间段的传播上下文环境由原推文以及发布时间小于的转发或评论推文构成。划分之后,对于推文事件Ev,其在时间段的推文传播上下文可表示为所包含的推文传播树由表示,推文传播树中包含的交互关系为
[0014][0015]该时间段的各个推文表示为时间分布为推文M的发布时间小于在时间段的传播上下文表示为按照时间阈值Δt,整个推文事件可划分为Q个阶段::
[0016][0017]其中,t0表示原创推文的发布时间,t
N
表示按照时间排列的最后一个转发推文的发
布时间,最终按照该划分方法,推文
[0018]3、推文多阶段传播上下文建模
[0019](1)由步骤2得到推文信息传播的各个阶段(1)由步骤2得到推文信息传播的各个阶段时间段的传播上下文表示为根据各推文的发布时间分布得到推文的信息传播序列,其文本表示为使用Bi

LSTM神经网络对推文时间序列进行学习,建模相邻推文之间的关联关系。通过Bi

LSTM网络可以分别得到正序和逆序两个方向上推文的隐藏层表示将两者进行拼接得到通过Bi

LSTM网络学习的推文文本的隐特征h
i
。通过注意力机制进行加权求和得到时序关系上下文环境下的阶段信息的表示
[0020](2)由步骤2得到推文信息传播的各个阶段(2)由步骤2得到推文信息传播的各个阶段阶段根据各推文的转发、评论关系构成信息传播树使用GAT进行建模学习。对于该阶段的传播子树,各文本表示为通过GAT网络学习具有转发评论关系的推文之间的相互本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于动态信息传播演化模式的虚假信息检测方法,该方法包括以下步骤:(1)文本特征嵌入根据数据集提供的句子中各个单词的表示,通过双向RNN网络和注意力机制进行特征提取和聚合,得到数据集中各个句子的向量表示;(2)信息传播过程的多阶段划分根据推文传播上下文中所包含的推文的最长时间跨度,以及各推文在时间维度上的分布情况,选择时间阈值Δt对推文传播的上下文环境进行阶段性的划分,从而得到处于不同时间阶段的推文传播的上下文环境;(3)推文多阶段传播上下文建模根据步骤(2)划分得到的处于不同时间阶段的推文传播的上下文环境,对于各时间阶段的推文的传播上下文环境,分别从时间和交互关系两个角度去考虑,使用时序模型得到时间上下文环境下的阶段信息的表示,使用图注意力模型得到交互关系上下文环境下的阶段信息的表示,之后对两者进行拼接,得到在时间和交互关系两种上下文环境下的阶段信息的整体表示;(4)推文传播的动态演化模式分析与表示将步骤(3)得到的在时间和交互关系两种上下文环境下的阶段信息的整体表示按照其时序关系组织为序列型数据,使用RNN模型对该序列型数据进行建模分析,得到具有阶段上下文环境的各时间阶段的信息表示,并通过平均池化对具有阶段上下文环境的各时间阶段的信息表示进行融合得到推文传播信息的整体表示;(5)虚假信息检测通过步骤(4)得到推文传播信息的整体表示,训练多层感知机网络,构建虚假信息检测模型,进行虚假信息的检测;(6)系统功能展示。2.根据权利要求1所述的基于动态信息传播演化模式的虚假信息检测方法,其特征在于,步骤(1)所述的文本特征嵌入的具体过程为:根据信息传播过程中的各个推文的初始表示X={x0,x1,

,x
N
},x
i
=[x
i,1
,x
i,2
,

,x
i,n
],其中,x
i
表示第i条推文,N表示数据集中共有N条推文,x
i,j
表示第i条推文的第j个单词,n表示句子中单词的个数;使用双向RNN模型进行单词之间依赖关系的学习,分别得到各个单词在正序和逆序方向上RNN隐藏层的状态表示,将推文i中第j个单词在正序和逆序上分别被表示为对两者进行拼接得到经过RNN模型编码后的第j个单词表示h
i,j
;使用注意力机制进行加权求和即可得到推文i的文本嵌入表示z
i
,最后学习得到推文事件中各推文的初始向量表示为Z={z0,z1,

,z
N
}。3.根据权利要求1所述的基于动态信息传播演化模式的虚假信息检测方法,其特征在于,步骤(2)中所述的信息传播过程的多阶段划分的具体过程为:对于每一个给定的推文事件Ev={Z,G,T},其中,Z={z0,z1,

,z
N
}为推文事件中各推文的初始向量表示;G=(V,E)为推文事件中各推文的传播树,其中,V表示推文传播树中所包含的原创推文及转发推文节点的集合,E表示原创推文及转发推文之间的交互关系,包括转发、评论所代表的边的集合;T={t0,t1,

,t
N
}为推文事件中各推文的发布时间;根据设
置的时间阈值Δt对信息的传播过程进行多阶段划分,得到时间段的传播上下文,其中:时间段的传播上下文,其中:时间段的传播上下文由原推文以及发布时间小于时间段的转发或评论推文构成;划分之后,对于推文事件Ev,其在时间段的传播上下文表示为所包含的推文传播树由表示,推文传播树中包含的交互关系为表示,推文传播树中包含的交互关系为该时间段的各个推文的初始向量表示为各个推文的发布时间分布为推文M的发布时间小于在时间段的传播上下文表示为时间段的传播上下文表示为按照时间阈值Δt,整个推文事件可划分为Q个阶段:其中,t0表示原创推文...

【专利技术属性】
技术研发人员:刘波杨欣妍郝宵荣曹玖新
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1