【技术实现步骤摘要】
一种基于多模态异常检测机制的假新闻识别方法
[0001]本专利技术属于人工智能
,特别涉及一种基于多模态异常检测机制的假新闻识别方法。
技术介绍
[0002]目前,虚假新闻会对个人、国家和社会造成十分严重的影响,利用AI技术来识别假新闻有着巨大的实际需求。基于文本分析的假新闻识别方法会找到文本上下文的语义不一致,以此判别是否为假新闻。基于图像造假检测的假新闻识别方法可以鉴别出新闻中的图片是否被修改,以此判别是否为假新闻。
[0003]现有的技术无论是基于文本分析的还是基于图像造假检测的假新闻识别方法,都只利用文本和图像等单模态数据,而对于包含文本和图像新闻来说,这些方法没有充分考虑新闻的多模态属性以及多模态数据之间的联系,对假新闻的识别准确性较差。在假新闻中,有一种新闻是图片是没经过任何修改,文本的上下文语义也一致,但是由于图片和文本不匹配而导致的虚假新闻。无论是基于文本分析的方法或者是基于图像造假检测的方法都无法识别该类型的虚假新闻,这是基于单模态假新闻识别方法的盲区。
技术实现思路
[0004]针对图片和文本不匹配导致的虚假新闻,本专利技术提供一种基于多模态异常检测机制的假新闻识别方法,以解决现有的假新闻识别方法的盲区问题。
[0005]本专利技术提供如下的技术方案:
[0006]一种基于多模态异常检测机制的假新闻识别方法,其特征在于,其包括如下步骤:
[0007]S1,从新闻网站中获取新闻中图片和文本的信息;
[0008]S2,根据具体的算法挖掘图片
【技术保护点】
【技术特征摘要】
1.一种基于多模态异常检测机制的假新闻识别方法,其特征在于,其包括如下步骤:S1,从新闻网站中获取新闻中图片和文本的信息;S2,根据具体的算法挖掘图片和文本的相关信息;S3,检测输入的新闻中的图片和文本信息是否一致,判别真假新闻。2.根据权利要求1所述的基于多模态异常检测机制的假新闻识别方法,其特征在于,所述S2中的根据具体的算法挖掘图片的相关信息,包括:将图片通过Faster
‑
Rcnn得到图片特征I={I1,I2,
…
,I
m
},其中Faster
‑
Rcnn的作用是提取图片中区域的特征,I
m
为单个区域的特征,m为区域的个数。3.根据权利要求1所述的基于多模态异常检测机制的假新闻识别方法,其特征在于,所述S2中的根据具体的算法挖掘文本的相关信息,包括:将文本通过BERT得到文本特征为C={C1,C2,
…
,C
n
},其中BERT的作用是提取文本中单个单词的特征,C
n
为单个区域的特征,n为单词的个数。4.根据权利要求1所述的基于多模态异常检测机制的假新闻识别方法,其特征在于,所述S2中的根据具体的算法挖掘图片和文本的相关信息,包括:将图片与文本特征通过全连接层映入相同语义空间,公式如下:I'=W
img
I;C'=W
cap
C;其中C为文本特征,I为图片特征;W
img
是对图片进行嵌入处理的全连接层中需要学习的参数,W
cap
是对文本进行嵌入处理的全连接层中需要学习的参数;C
′
为文本有包含单词特征的文本特征,C
′
={C
′1,C
′2,...,C
′
n
};I
′
为图片有包含区域特征的图片特征,I
′
={I
′1,I
′2,...,I
′
m
}。5.根据权利要求1所述的基于多模态异常检测机制的假新闻识别方法,其特征在于,所述S2中的根据具体的算法挖掘图片和文本的相关信息包括:在图卷积神经网络的传导规则中,需要输入邻接矩阵和节点特征矩阵;对于邻接矩阵,使用扩展后的相关性矩阵代替;在同一语义空间中,对于图片有包含区域特征的图片特征I'={I
′1,I
′2,...,I
′
m
},对于...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。