一种基于元迁移学习的社交媒体假消息检测方法技术

技术编号:38140757 阅读:6 留言:0更新日期:2023-07-08 09:55
本发明专利技术公开了一种基于元迁移学习的社交媒体假消息检测方法,收集社交媒体上某个事件的文本与图像数据,利用深度学习模型提取文本特征与图像特征,并利用元迁移学习模型学习历史事件中的知识,帮助模型实现对于新发生事件的检验。本发明专利技术的核心机制是元学习的两阶段训练过程:在事件自适应训练阶段将训练集划分为不同的任务对内部模型进行训练,优化模型的初始化参数。在特定事件检测阶段用优化后的模型在新出现事件进行测试,针对特定事件快速优化模型。本发明专利技术方法能够提取不同事件中的共性知识用于迁移到新事件的检测中,利用少量新事件样本数据即可实现准确的新事件假消息检测,以具备对新出现事件的快速检测能力。具备对新出现事件的快速检测能力。具备对新出现事件的快速检测能力。

【技术实现步骤摘要】
一种基于元迁移学习的社交媒体假消息检测方法


[0001]本专利技术属于深度学习
,具体涉及一种社交媒体假消息检测方法。

技术介绍

[0002]“假消息”指具有一定事实基础的且在有限时间内能够被证实为假的社交帖子或新闻。社交媒体平台的迅速发展使得任何用户都有发布假消息的自由,因此假消息可以在人群中快速、广泛传播,不仅造成了社会的恐慌,还给人们的健康埋下了隐患。对社交媒体空间中的假消息进行有效检测具有重要意义。
[0003]传统的假消息检测方法主要结合消息的内容特征(例如文本及评论信息)、传播特征(例如转发结构)和交互特征(例如点赞数量),应用卷积神经网络(Convolutional Neural Networks,CNN)、循环神经网络(Recurrent Neural Network,RNN)等深度神经网络进行特征提取并分类识别。然而传统的方法需要大量的标注数据对模型进行训练,针对新出现事件(例如新冠疫情,恐怖袭击等),往往难以在短时间内收集训练模型需要的高质量相关标注数据,导致模型泛化性能较差。此外,不同假消息事件具有不同的主题和用户评论内容,往往呈现不同的数据特征分布,而现有的检测方法忽略了不同事件真假消息的分布差异,模型多学习到的是针对于特定事件的高阶特征,对于在训练集中未出现过的新事件的识别效果通常较差。现有假消息检测方法泛化性较差,无法快速检测新发生事件的问题。

技术实现思路

[0004]为了克服现有技术的不足,本专利技术提供了一种基于元迁移学习的社交媒体假消息检测方法,收集社交媒体上某个事件的文本与图像数据,利用深度学习模型提取文本特征与图像特征,并利用元迁移学习模型学习历史事件中的知识,帮助模型实现对于新发生事件的检验。本专利技术的核心机制是元学习的两阶段训练过程:在事件自适应训练阶段将训练集划分为不同的任务对内部模型进行训练,优化模型的初始化参数。在特定事件检测阶段用优化后的模型在新出现事件进行测试,针对特定事件快速优化模型。本专利技术方法能够提取不同事件中的共性知识用于迁移到新事件的检测中,利用少量新事件样本数据即可实现准确的新事件假消息检测,以具备对新出现事件的快速检测能力。
[0005]本专利技术解决其技术问题所采用的技术方案包括如下步骤:
[0006]步骤1:利用Text

CNN网络提取消息的文本特征,利用VGG

19网络提取消息的图像特征;对于事件e的上下文数据x
e,k
∈X
e
,将其作为原始数据输入到特征提取器中,提取到的特征嵌入表示为c
e,k
∈C
e
;X
e
表示事件的上下文数据,C
e
表示将上下文数据输入到特征提取器后学习到的高维特征;
[0007]步骤2:将标签表示为与图像特征和文本特征相同维度的嵌入,即标签嵌入,并与提取到的特征嵌入进行拼接:
[0008][0009]式中,v
e,k
表示第k条数据对应的标签向量,K表示数据集中的消息数量,V
e
表示标
签向量集合;
[0010]步骤3:将上下文嵌入表示为检测目标的特征向量表示为将两个向量进行拼接,输入到真假消息分类器,输出向量为d表示输入向量的维数;
[0011]步骤4:将标签嵌入vec(fake)和vec(real)作为度量标准,与真假消息分类器的输出O
e,i
进行相似性度量:
[0012][0013]使用softmax将相似性度量向量映射到[0,1]之间作为该消息为真或假文本的概率表示;
[0014]步骤5:对于每个事件e,对其构建两个数据集:支持集和询问集事件自适应训练阶段,使用支持集进行训练,其中以第i条消息作为检测目标,其余的数据作为上下文数据,将检测目标的上下文数据输入模型,输入预测结果;损失通过比较预测标签和实际标签来计算:
[0015][0016]其中θ表示模型中的所有参数;
[0017]计算损失后,对于每个事件e进行梯度下降,更新参数θ:
[0018][0019]步骤6:特定事件检测阶段,利用事件自适应训练阶段得到的参数集θ
e
作为初始参数,将询问集和整个支持集作为输入,得到询问集预测的标签集再与询问集的实际标签集相比较计算损失:
[0020][0021]步骤7:通过元学习过程,学习到一个优选初始化参数集,该参数集学习使用给定的上下文的输入作为条件,检测新闻事件。
[0022]本专利技术的有益效果如下:
[0023]本专利技术方法能够提取不同事件中的共性知识用于迁移到新事件的检测中,利用少量新事件样本数据即可实现准确的新事件假消息检测,以具备对新出现事件的快速检测能力。
附图说明
[0024]图1为本专利技术方法流程图。
[0025]图2为本专利技术方法自适应训练示意图。
[0026]图3为本专利技术实施例在Weibo数据集训练后模型的损失曲线以及不同指标的验证曲线。(a)训练过程损失,(b)验证过程曲线。
具体实施方式
[0027]下面结合附图和实施例对本专利技术进一步说明。
[0028]本专利技术提出一种元迁移学习的分类方法。对于每个事件e,对其构建两个数据集:支持集和询问集本专利技术的目标是利用从以往事件中获得的知识及关于事件e的一些示例样本(如支持集),对对应的询问集寻求一个有效的预测函数F(s)

{0,1},使预测结果满足:
[0029][0030]具体的,本专利技术包含三个模块:特征提取器分为两部分,一部分为文本特征提取器,其输入是非结构化的消息文本内容,利用Text

CNN网络提取文本内容特征向量;另一部分为图像特征提取器,利用VGG19网络提取输入图像的特征向量。对于支持集,为了捕获标签的语义,利用标签嵌入算法将true或fake标签转换为语义向量表示。特征聚合器接收标签嵌入与学习后的高维向量,避免二者之间的维度差异带来的信息损失。检测器进行真假消息的分类检测,并利用梯度下降算法对整个模型进行优化。在训练阶段本专利技术利用了元学习的训练流程,整个训练阶段分为两部分:第一部分利用支持集和目标集进行训练,把每个批次的损失相加作为总损失进行梯度下降,最终得到一个最好的初始化参数。第二部分是关于目标事件用于模型的微调,常规地使用训练集和测试集进行训练,优化参数。本专利技术可结合用户交互数据,利用元迁移学习方法基于小样本、多模态地检测社交媒体中的假消息,并快速检测新发生的事件。
[0031]为实现上述任务,本专利技术采用以下技术方案:
[0032]如图1所示,一种基于元迁移学习的社交媒体假消息检测方法,包括以下步骤:
[0033]步骤1:利用Text

CNN网络进行提取消息的文本特征,利用VGG

19网络提取消息的图像特征。对于事件e的上下文数据x
e,k
∈X<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于元迁移学习的社交媒体假消息检测方法,其特征在于,包括以下步骤:步骤1:利用Text

CNN网络提取消息的文本特征,利用VGG

19网络提取消息的图像特征;对于事件e的上下文数据x
e,k
∈Xe,将其作为原始数据输入到特征提取器中,提取到的特征嵌入表示为c
e,k
∈Ce;Xe表示事件的上下文数据,Ce表示将上下文数据输入到特征提取器后学习到的高维特征;步骤2:将标签表示为与图像特征和文本特征相同维度的嵌入,即标签嵌入,并与提取到的特征嵌入进行拼接:式中,v
e,k
表示第k条数据对应的标签向量,K表示数据集中的消息数量,V
e
表示标签向量集合;步骤3:将上下文嵌入表示为检测目标的特征向量表示为将两个向量进行拼接,输入到真假消息分类器,输出向量为d表示输入向量的维数;...

【专利技术属性】
技术研发人员:郭斌沈豪宬丁亚三刘思聪於志文王柱
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1