一种解决特征中和效应的多模态虚假新闻检测方法及装置制造方法及图纸

技术编号：38656588 阅读：8 留言：0更新日期：2023-09-02 22:42

本发明专利技术提供一种解决特征中和效应的多模态虚假新闻检测方法及装置，所述方法包括：对于多模态虚假新闻检测任务，给定训练数据集；所述训练数据集包括多组图像模态和文本模态的内容；使用深度学习模型对图像模态和文本模态的内容进行特征提取，并映射到同一特征空间，得到每组中图像模态和文本模态的深层特征，形成特征对；获取两个模态对应的单模态真实性预测结果；对于每个特征对，结合单模态真实性预测结果，将特征对融合为一个多模态特征；对多模态特征的真实性进行预测。本发明专利技术能够解决多模态特征融合导致的中和效应问题，提高虚假新闻检测的准确率。高虚假新闻检测的准确率。高虚假新闻检测的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种解决特征中和效应的多模态虚假新闻检测方法及装置

[0001]本专利技术涉及信息
，尤其涉及一种解决特征中和效应的多模态虚假新闻检测方法及装置。

技术介绍

[0002]现有的虚假新闻的检测方法大多使用新闻文本内容进行检测，利用先进的人工智能技术从训练数据中学习内容模式和传播模式。而社交平台上的新闻大多不只包含文本内容，而是存在文本、图片、视频等多模态内容。人工智能领域也开始逐渐关注于多模态的虚假新闻检测任务，对不同模态的内容分别编码并映射到相同的特征空间，再使用特定的融合模块将多个模态的特征进行融合，最终进行分类。
[0003]最新的多模态虚假新闻检测模型为CAFE[Chen Y,Li D,Zhang P,et al.Cross
‑
modal ambiguity learning for multimodal fake news detection[C]//Proceedings of the ACM Web Conference 2022.2022:2897
‑
2905]，它分别使用预训练的ResNet网络结构和BERT模型对图像和文本进行特征抽取，使用多层神经网络将二者的特征映射到同一空间并拼接后进行最终的真实性分类。这个模型的新颖性在于建模模态之间的不一致性来帮助上述的特征拼接操作。具体地，它使用变分编码器将每个模态的特征映射为一个高斯分布，再使用Kullback
‑
Leibler散度计算分布之间的距离，以此建模出他们的不一致性。
[...

【技术保护点】

【技术特征摘要】
1.一种解决特征中和效应的多模态虚假新闻检测方法，其特征在于，包括以下步骤：S1，对于多模态虚假新闻检测任务，给定训练数据集；所述训练数据集包括多组图像模态和文本模态的内容；S2，使用深度学习模型对图像模态和文本模态的内容进行特征提取，并映射到同一特征空间，得到每组中图像模态和文本模态的深层特征，形成特征对；S3，获取两个模态对应的单模态真实性预测结果；S4，对于每个特征对，结合单模态真实性预测结果，将特征对融合为一个多模态特征；S5，对多模态特征的真实性进行预测。2.根据权利要求1所述的多模态虚假新闻检测方法，其特征在于，所述步骤S1中，训练数据集为其中为图像模态和文本模态的内容，y
i
∈{0，1}为新闻对应的真实性标签，0表示虚假，1表示真实。3.根据权利要求2所述的多模态虚假新闻检测方法，其特征在于，所述步骤S2中，对于每张图片深层特征为对于每个文本深层特征为形成特征对为其中和分别表示基于深度学习模型的图像编码器和文本编码器及其对齐操作。4.根据权利要求3所述的多模态虚假新闻检测方法，其特征在于，所述步骤S3中，将单模态真实性分类的问题转化为PU学习问题；当一条新闻为真时，它的两个单模态真实性一定都为真，基于这个事实，将初始的训练数据集转化为积极的单模态数据集和无标注的单模态数据集其中M表示训练数据集中真实性标签为真的样本数；在这两个数据集的基础上，将单模态真实性分类问题转化为PU学习问题，变分PU学习方法从数据集中随机地采样一个批次其中由积极子集和无标注子集该部分的深度学习目标函数为：其中表示基于前向传播网络的单模态真实性分类操作，用于预测z
I
和z
T
单模态的真实性，即真实或虚假；log(
·
)表示以自然常数e为底的对数；由于z
I
和z
T
来自于不同的模态数据，为了确保使用同一套框架进行计算，基于对比学习技术提出模态对齐的目标函数：其中τ为温度系数，cos(
·
，
·
)为余弦相似度，e...

【专利技术属性】
技术研发人员：李熙铭，王兵，李长春，
申请(专利权)人：吉林大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人