【技术实现步骤摘要】
本专利技术涉及信息内容安全,特别涉及一种知识增强异质图注意力的虚假信息检测方法及系统。
技术介绍
1、由于社交媒体的短文本特性以及假信息表现形式上的多样性,导致仅从帖文自身内容出发很难挖掘出能够鉴别信息真假的有效线索,使得面向社交媒体的虚假信息检测任务变得极具挑战性。为了缓解社交媒体短文本特性带来的语义稀疏问题,研究者们提出了基于内容语义增强的检测方法,旨在解决低资源场景下的假信息早期检测问题。其核心思想是:社交网络帖文中包含的关键实体词可以揭示核心主题,引入这些实体的背景知识可以丰富短文本的语义内容。因此,如何得到帖子文本内容的背景知识,并将这些知识融合到文本信息中成为了关键问题。
2、根据模型知识获取策略的不同,大致可以分为两大方向:基于预训练语言模型的方法和基于知识驱动图卷积的方法。基于预训练语言模型增强内容语义理解的方法,其核心理念在于借助模型内部蕴含的知识结构,通过微调、提示学习等技术对帖子中潜在语言模式和语义线索进行挖掘,有效地增强了对假信息的检测效果。这种方法仅适用于那些在模型预训练与微调过程中已充分涉及相关背
...【技术保护点】
1.一种知识增强异质图注意力的虚假信息检测方法,其特征在于,包含以下步骤:
2.根据权利要求1所述的知识增强异质图注意力的虚假信息检测方法,其特征在于,构建异质文本图的过程包含生成多类型节点及节点的初始向量表示:首先对每一条帖文形成实体词集合Ste、模式词集合Stp和概念知识集合Stk;利用预训练模型BERT进行初始化得到其中表示所有实体类型词的初始特征表示,表示所有模式类型词的初始特征表示,表示所有概念描述的初始特征表示;设表示图中所有节点组成的初始节点特征表示矩阵,V|=2n+l,n表示帖文中包含的实体的数量,l表示帖文中包含的模式词的数量。
< ...【技术特征摘要】
1.一种知识增强异质图注意力的虚假信息检测方法,其特征在于,包含以下步骤:
2.根据权利要求1所述的知识增强异质图注意力的虚假信息检测方法,其特征在于,构建异质文本图的过程包含生成多类型节点及节点的初始向量表示:首先对每一条帖文形成实体词集合ste、模式词集合stp和概念知识集合stk;利用预训练模型bert进行初始化得到其中表示所有实体类型词的初始特征表示,表示所有模式类型词的初始特征表示,表示所有概念描述的初始特征表示;设表示图中所有节点组成的初始节点特征表示矩阵,v|=2n+l,n表示帖文中包含的实体的数量,l表示帖文中包含的模式词的数量。
3.根据权利要求2所述的知识增强异质图注意力的虚假信息检测方法,其特征在于,构建异质文本图的过程还包含基于语义依存和共现关联双重度量的策略构建节点间关联关系:
4.根据权利要求1所述的知识增强异质图注意力的虚假信息检测方法,其特征在于,双层图注意力机制包含类型级注意力和节点级注意力:
5.根据权利要求4所述的知识增强异质图注意力的虚假...
【专利技术属性】
技术研发人员:陈静,周刚,兰明敬,卢记仓,李志博,但文皓,王世宇,李顺航,王婧,
申请(专利权)人:中国人民解放军网络空间部队信息工程大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。