基于图像情感倾向的多模态谣言检测方法技术

技术编号：26597843 阅读：28 留言：0更新日期：2020-12-04 21:20

本发明专利技术公开了一种基于图像情感倾向的多模态谣言检测方法，一方面，此方法对图中带有文字的样本有更好的针对性。同时，区别于以往使用情感分析的方法，基于条件变分自编码器(CVAE)提出了提取图像情感倾向的方法，通过测试可以观察到其有效性。该方法只需使用单个图像作为输入便可以获得精确的检测结果，可以在谣言传播初期迅速检测并处理。

全部详细技术资料下载

【技术实现步骤摘要】
基于图像情感倾向的多模态谣言检测方法
本专利技术涉及网络空间安全
，尤其涉及一种基于图像情感倾向的多模态谣言检测方法。
技术介绍
社交媒体的发展在加速信息传播的同时，也带来了虚假谣言信息的泛滥，往往会引发诸多不安定因素，并对经济和社会产生巨大的影响。当今社交网络平台用户早已破亿，其传播面广、传播迅速、使用面广、不受时间空间限制和其放大镜特征将信息影响力成倍放大。不切实际的谣言，“操纵”了舆论感情，误导了公众的判断，更影响了社会稳定，所以针对网络谣言的自动和迅速检测对网络空间安全具有重要意义。社交媒体谣言往往带有一些具有明显煽动性的特征，从这一角度出发，基于文本的情感分析的方法在谣言检测中大放异彩，但随着多媒体生产技术的发展，谣言逐渐以图文并茂的方式吸引和误导读者，而且图片往往视觉冲击性很强，有丰富的潜在信息可以挖掘。另外，在海量的社交媒体数据中，图像和文本信息并非以完全分离的形式呈现，仍有相当一部分图像数据中包含大量的文本，这部分文本往往蕴含着与主题联系紧密的语义信息，有助于建立图像与情感倾向的联系，但以往的多模态检测方法并不能良好地把握住这一辅助信息。
技术实现思路
本专利技术的目的是提供一种基于图像情感倾向的多模态谣言检测方法，只需使用单个图像作为输入便可以获得精确的检测结果，可以在谣言传播初期迅速检测并处理。本专利技术的目的是通过以下技术方案实现的：一种基于图像情感倾向的多模态谣言检测方法，包括：训练阶段，利用文本以及包含文字信息的图像作为训练数据；对每...

【技术保护点】
1.一种基于图像情感倾向的多模态谣言检测方法，其特征在于，包括：/n训练阶段，利用文本以及包含文字信息的图像作为训练数据；对每一组由文本及图像构成的训练样本，进行多模态特征的提取，包括：文本特征、图像特征以及图像中的文字信息特征；基于条件变分自编码器，结合图像特征、图像中的文字信息特征、文本特征、语义空间的隐变量，以及给定的情感倾向标签来更新先验分布及分类器，所述隐变量即为图像的语义；/n测试阶段，对于待检测图像与相应的文本，从图像中提取出文字信息特征，结合更新后的先验分布采样得到的隐变量解码生成情感倾向，再与文本特征拼接，通过分类器得到待检测图像为谣言的概率。/n

【技术特征摘要】
1.一种基于图像情感倾向的多模态谣言检测方法，其特征在于，包括：
训练阶段，利用文本以及包含文字信息的图像作为训练数据；对每一组由文本及图像构成的训练样本，进行多模态特征的提取，包括：文本特征、图像特征以及图像中的文字信息特征；基于条件变分自编码器，结合图像特征、图像中的文字信息特征、文本特征、语义空间的隐变量，以及给定的情感倾向标签来更新先验分布及分类器，所述隐变量即为图像的语义；
测试阶段，对于待检测图像与相应的文本，从图像中提取出文字信息特征，结合更新后的先验分布采样得到的隐变量解码生成情感倾向，再与文本特征拼接，通过分类器得到待检测图像为谣言的概率。

2.根据权利要求1所述的一种基于图像情感倾向的多模态谣言检测方法，其特征在于，进行多模态特征的提取之前进行数据预处理，包括：
对于文本进行去冗余操作，只保留文字信息，并拼接为文本序列；
对于图像，进行去噪处理。

3.根据权利要求1所述的一种基于图像情感倾向的多模态谣言检测方法，其特征在于，
通过预训练的GLoVe对文本进行词特征的向量化，并送入GRU进行特征提取，获得的语义向量即为文本特征；
通过预训练模型ResneXt提取图像的通用特征表示，将预训练模型ResneXt最后一个池化层输出的特征，作为图像特征；
通过开源的中文光学字符识别套件CNOCR获取...

【专利技术属性】
技术研发人员：毛震东，张勇东，赵博文，付哲仁，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人