当前位置: 首页 > 专利查询>西北大学专利>正文

一种基于跨模态推文图的标签传播虚假新闻检测方法技术

技术编号:38755300 阅读:29 留言:0更新日期:2023-09-10 09:40
本发明专利技术涉及社交媒体分析和虚假信息检测技术领域,特别涉及一种基于跨模态推文图的标签传播虚假新闻检测方法,包括步骤:S1、构建跨模态推文图,跨模态推文图用于捕捉推文的相关性;S2、基于跨模态推文图,采用特征上下文网络学习推文之间的相关性,以利用学习结果进行推文真假预测;S3、利用标签传播网络为预测结果分配双向标签注意力,用于捕捉预测结果中推文预测标签的正负相关性;S4、对特征上下文网络和标签传播网络进行训练,得到虚假新闻检测模型;基于CLIP构建得到的跨模态推文图成功捕捉到了未知事件的真假新闻的潜在结构;同时通过FCN进一步增强了真假新闻推文之间的区分度;并通过域泛化损失提高虚假新闻检测模型对未见事件的检测能力。见事件的检测能力。见事件的检测能力。

【技术实现步骤摘要】
一种基于跨模态推文图的标签传播虚假新闻检测方法


[0001]本专利技术涉及社交媒体分析和虚假信息检测
,特别涉及一种基于跨模态推文图的标签传播虚假新闻检测方法。

技术介绍

[0002]虚假新闻检测通常被视为二元分类问题;早期的方法使用从文本内容中提取的特征来训练虚假新闻分类器,而这种方法需要昂贵的预处理和繁琐的特征工程;现有的一些研究试图利用明确的社交背景来建立推文之间的联系,例如基于推文的转发和标签的图形构建以及使用图神经网络(GNNs)来模拟它们之间的关系;借助GNNs的帮助,可以聚合相邻的推文,以获得更全面的表示。
[0003]但现有的推文检测方法中存在以下缺陷:1.仅仅依靠一条推文来确定原始事件的真实性是片面的和不可靠的,现有方法很多只采用了单个推文进行推测,没有将同一类事件的推文之间的关系和交互纳入考虑,忽略了可以帮助虚假新闻检测的社交上下文信息;2.仅基于社交背景构建的图比较稀疏,而这种稀疏连接会妨碍对推文之间可能的交互作用的捕捉;3.在训练用于假新闻检测的模型时,过度拟合训练数据是一个主要挑战,导致在未看到的推文上表本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于跨模态推文图的标签传播虚假新闻检测方法,其特征在于,包括以下步骤:S1、构建跨模态推文图,所述跨模态推文图用于捕捉推文的相关性;S2、基于所述跨模态推文图,采用特征上下文网络学习推文之间的相关性,以利用学习结果进行推文真假预测;S3、利用标签传播网络为S2所得预测结果分配双向标签注意力,用于捕捉所述预测结果中推文预测标签的正负相关性;S4、对所述特征上下文网络和所述标签传播网络进行训练,得到虚假新闻检测模型;S5、采用所述虚假新闻检测模型进行推文检测。2.根据权利要求1所述的一种基于跨模态推文图的标签传播虚假新闻检测方法,其特征在于:所述S1中,所述跨模态推文图的构建,包括;采用CLIP模型提取推文特征,所述推文特征包括图像模态的特征和文本模态的特征,计算所有模态组合的余弦相似度,并设定相似性阈值;若所述推文中至少一个模态组合的余弦相似度超过所述相似性阈值,则所述推文之间存在潜在的相关性。3.根据权利要求2所述的一种基于跨模态推文图的标签传播虚假新闻检测方法,其特征在于:所述模态组合具体包括;图像到图像;文本到文本;图像到文本;文本到图像。4.根据权利要求1所述的一种基于跨模态推文图的标签传播虚假新闻检测方法,其特征在于:所述S2中,所述特征上下文网络的学习方法,包括;所述特征上下文网络聚合相邻推文以对比其他推文。5.根据权利要求1所述的一种基于跨模态推文图的标签传播虚假新闻检测方法,其特征在于:所述S3中,所述标签传播网络用于整合相邻推文的预测结果,通过堆叠双向标签注意力层来平滑标签,并分析标签的正面和负面相关性,集成与所述推文相应的预测标签,其中;设定来自特征上下文网络的最终层上下文特征并将最终层上下文特征向量输入多层感知机生成二维logits向量,再通过softmax函数将二维logits向量转换为类概率其中,表示推文d
i
为真实的概率,表示推文d
i
为虚假的概率;在所述标签传播网络中使用L'个标签注意力层,并给定来自第l个标签注意力层的标签用于传递类别概率到后续的标签注意力层中进行更新和调整,其中;对第2个标签注意力层的标签进行更新:进行更新:其中,

为逐元素乘法,为推文i和推文j之间的双向
标签注意力权重,且双向标签注意力权重α
ij
基于上下文特征,为输入的类别概率;[
·
,
·
]为连接,tanh是双曲正切函数,A和V为可学习的权重矩阵,且A∈R2×
2d
,V∈R
d
×
d
,是第l层中推文i的上下文特征,是第l层中推文j的上下文特征。6.根据权利要求1所述的一种基于跨模态推文图的标签传播虚假新闻检测方法,其特征在于:所述S4中,将训练数据集分为两个不相交的子集D
s
和子集D
u
,所述子集D
s
用于训练所述特征上下文网络和所述标签传播网络,所述子集D
u
用于更新所述特征上下文网络;利用所述子集D
s
上预测标签的交叉熵损失的最小化训练所述特征上下文网络和所述标签传播网络,得到所述特征上下文网络的最小化交叉熵损失L
FCNmin
和所述标签传播网络的最小化交叉熵损失L
LPNmin
,所述标签传播网络从所述子集D
s
中的推文特征学习初始分类预测标签,并通过所述标签传播网络学习有效地聚合相邻推文的标签,来捕捉相邻推文之间的相关性,再将所述跨模态推文图推广到未见过的推文...

【专利技术属性】
技术研发人员:赵万青陈海源张翔彭进业
申请(专利权)人:西北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1