一种基于元迁移学习的社交媒体假消息检测方法技术

技术编号：38140757 阅读：6 留言：0更新日期：2023-07-08 09:55

本发明专利技术公开了一种基于元迁移学习的社交媒体假消息检测方法，收集社交媒体上某个事件的文本与图像数据，利用深度学习模型提取文本特征与图像特征，并利用元迁移学习模型学习历史事件中的知识，帮助模型实现对于新发生事件的检验。本发明专利技术的核心机制是元学习的两阶段训练过程：在事件自适应训练阶段将训练集划分为不同的任务对内部模型进行训练，优化模型的初始化参数。在特定事件检测阶段用优化后的模型在新出现事件进行测试，针对特定事件快速优化模型。本发明专利技术方法能够提取不同事件中的共性知识用于迁移到新事件的检测中，利用少量新事件样本数据即可实现准确的新事件假消息检测，以具备对新出现事件的快速检测能力。具备对新出现事件的快速检测能力。具备对新出现事件的快速检测能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于元迁移学习的社交媒体假消息检测方法

[0001]本专利技术属于深度学习
，具体涉及一种社交媒体假消息检测方法。

技术介绍

[0002]“假消息”指具有一定事实基础的且在有限时间内能够被证实为假的社交帖子或新闻。社交媒体平台的迅速发展使得任何用户都有发布假消息的自由，因此假消息可以在人群中快速、广泛传播，不仅造成了社会的恐慌，还给人们的健康埋下了隐患。对社交媒体空间中的假消息进行有效检测具有重要意义。
[0003]传统的假消息检测方法主要结合消息的内容特征(例如文本及评论信息)、传播特征(例如转发结构)和交互特征(例如点赞数量)，应用卷积神经网络(Convolutional Neural Networks,CNN)、循环神经网络(Recurrent Neural Network,RNN)等深度神经网络进行特征提取并分类识别。然而传统的方法需要大量的标注数据对模型进行训练，针对新出现事件(例如新冠疫情，恐怖袭击等)，往往难以在短时间内收集训练模型需要的高质量相关标注数据，导致模型泛化性能较差。此外，不同假消息事件具有不同的主题和用户评论内容，往往呈现不同的数据特征分布，而现有的检测方法忽略了不同事件真假消息的分布差异，模型多学习到的是针对于特定事件的高阶特征，对于在训练集中未出现过的新事件的识别效果通常较差。现有假消息检测方法泛化性较差，无法快速检测新发生事件的问题。

技术实现思路

[0004]为了克服现有技术的不足，本专利技术提供了一种基于元迁移学习的社交媒体假消息检测方法，收集社...

【技术保护点】

【技术特征摘要】
1.一种基于元迁移学习的社交媒体假消息检测方法，其特征在于，包括以下步骤：步骤1：利用Text
‑
CNN网络提取消息的文本特征，利用VGG
‑
19网络提取消息的图像特征；对于事件e的上下文数据x
e,k
∈Xe，将其作为原始数据输入到特征提取器中，提取到的特征嵌入表示为c
e,k
∈Ce；Xe表示事件的上下文数据，Ce表示将上下文数据输入到特征提取器后学习到的高维特征；步骤2：将标签表示为与图像特征和文本特征相同维度的嵌入，即标签嵌入，并与提取到的特征嵌入进行拼接：式中，v
e,k
表示第k条数据对应的标签向量，K表示数据集中的消息数量，V
e
表示标签向量集合；步骤3：将上下文嵌入表示为检测目标的特征向量表示为将两个向量进行拼接，输入到真假消息分类器，输出向量为d表示输入向量的维数；...

【专利技术属性】
技术研发人员：郭斌，沈豪宬，丁亚三，刘思聪，於志文，王柱，
申请(专利权)人：西北工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人