虚假信息检测方法、装置、设备及介质制造方法及图纸

技术编号：33710666 阅读：33 留言：0更新日期：2022-06-06 08:42

本公开提供了一种虚假信息检测方法，包括：获取待检测的社交媒体信息，其中，待检测的社交媒体信息包括待检测图像和第一待检测文本；在待检测图像中包含第二待检测文本的情况下，从第一待检测文本和第二待检测文本中提取待检测文本特征向量；结合空间域中的语义特征和频域中的物理特征，从待检测图像中提取待检测图像特征向量；将待检测文本特征向量和待检测图像特征向量融合，得到待检测融合特征向量；以及将待检测融合特征向量输入预先训练好的分类模型，输出检测结果。本公开还提供了一种虚假信息检测装置、设备、存储介质和程序产品。品。品。

全部详细技术资料下载

【技术实现步骤摘要】
虚假信息检测方法、装置、设备及介质

[0001]本公开涉及人工智能
，更具体地涉及一种虚假信息检测方法、装置、设备、介质和产品。

技术介绍

[0002]随着各类社交媒体的日益普及，社交媒体的各类信息(如文字、图片、视频、音频等)以其传播速度快、获取渠道多、产生门槛低等特点迅速成为大众信息消费的热点。然而，社交媒体的这些特点也使虚假新闻信息肆意泛滥。由于信息的不对称性，虚假消息可以通过社交媒体传播来误导不明真相的人群，造成不可估量的负面影响，甚至操纵社会舆论。虚假消息已经严重的影响社会安定，因此，对虚假消息进行快速、高效检测是一项迫切需要解决的技术问题。

技术实现思路

[0003]鉴于上述问题，本公开提供了一种虚假信息检测方法、装置、设备、介质和程序产品。
[0004]根据本公开的第一个方面，提供了一种虚假信息检测方法，包括：
[0005]获取待检测的社交媒体信息，其中，待检测的社交媒体信息包括待检测图像和第一待检测文本；
[0006]在待检测图像中包含第二待检测文本的情况下，从第...

【技术保护点】

【技术特征摘要】
1.一种虚假信息检测方法，包括：获取待检测的社交媒体信息，其中，所述待检测的社交媒体信息包括待检测图像和第一待检测文本；在所述待检测图像中包含第二待检测文本的情况下，从所述第一待检测文本和所述第二待检测文本中提取待检测文本特征向量；结合空间域中的语义特征和频域中的物理特征，从所述待检测图像中提取待检测图像特征向量；将所述待检测文本特征向量和所述待检测图像特征向量融合，得到待检测融合特征向量；以及将所述待检测融合特征向量输入预先训练好的分类模型，输出检测结果。2.根据权利要求1中所述的方法，其中，所述在所述待检测图像中包含第二待检测文本的情况下，从所述第一待检测文本和所述第二待检测文本中提取待检测文本特征向量包括：利用知识整合的增强表示模型对所述第一待检测文本编码，以便添加待检测文本标识，其中，所述待检测文本标识包括：第一待检测文本的句子、第一待检测文本中句子分隔符、待检测特征向量；提取所述待检测特征向量，得到第一待检测文本的信息；在所述待检测图像中包含所述第二待检测文本的情况下，从所述待检测图像中提取关于所述第二待检测文本的信息；利用文本分隔符，将所述第二待检测文本的信息与所述第一待检测文本的信息进行拼接，得到拼接信息；从所述拼接信息中提取所述待检测文本特征向量。3.根据权利要求1中所述的方法，其中，所述结合空间域中的语义特征和频域中的物理特征，从所述待检测图像中提取待检测图像特征向量包括：将所述待检测图像输入卷积神经网络，输出所述频域中的物理特征的矩阵；基于所述频域中的物理特征的矩阵，利用长短期记忆模型提取所述空间域中的语义特征，得到权重矩阵；基于所述频域中的物理特征的矩阵与所述权重矩阵，得到所述待检测图像特征向量。4.根据权利要求1中所述的方法，其中，所述预先训练好的分类模型通过预先训练的方法得到，所述预先训练的方法包括：获取在预设时间区间内产生的目标社交媒体信息，其中，所述目标社交媒体信息包括虚假信息、真实信息以及信息标签，所述虚假信息和所述真实信息均包括图像和第一文本；在所述图像中包含第二文本的情况下，从所述第一文本和所述第二文本中提取文本特征向量；结合所述空间域中的语义特征和所述频域中的物理特征，从所述图像中提取图像特征向量；将所述文本特征向量和所述图像特征向量融合，得...

【专利技术属性】
技术研发人员：李晓宇，黄飞，金力，孙显，马豪伟，张雅楠，
申请(专利权)人：中国科学院空天信息创新研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人