一种基于多模态关系的网络谣言检测方法技术

技术编号：23984748 阅读：41 留言：0更新日期：2020-04-29 12:59

本发明专利技术公开了一种基于多模态关系的网络谣言检测方法，包括：获取网络平台上发布的待检测的图像与相关的文本；通过预训练fasterR‑CNN模型提取出图像中包含不同类别物体的视觉特征向量；对文本进行预处理后，通过GRU进行语义向量的提取；通过注意力机制，捕捉视觉特征向量与语义向量的重要程度，并实现图像与文本之间跨模态关联，从而更新视觉特征向量与语义向量；并且，对于视觉特征向量与语义向量，通过注意力机制各自建模内部动态信息的关系，从而更新视觉特征向量与语义向量；将两部分更新得到的视觉特征向量与语义向量连接在一起，再通过二分类器，获得待检测的信息为谣言与真实类别的概率。该方法能够自动判断待检测信息是否属于网络谣言，且具有较高的检测准确度。

A network rumor detection method based on multimodal relation

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多模态关系的网络谣言检测方法
本专利技术涉及网络空间安全
，尤其涉及一种基于多模态关系的网络谣言检测方法。
技术介绍
网络社会的崛起使得机遇与挑战并存，尤其是互联网接入的低准入门槛和信息传播的自由性严重影响了网络空间的稳定，网络谣言的肆意传播就是其中一个必须引起重视的问题。当今社交网络平台用户早已破亿，活跃度极高，其传播面广、传播迅速、使用面广、不受时间空间限制和其放大镜特征将信息影响力成倍放大，尤其是一些敏感话题、焦点事件、热点问题、重大公共事件、突发事件一夕之间家喻户晓，或造成信任缺失、政府、企业形象受损、民怨沸腾，所以针对网络谣言的自动和迅速检测对网络空间安全具有重要意义。随着多媒体技术的发展，无论自媒体还是专业媒体都开始向基于图、文、短视频的多媒体新闻形式转变。多媒体内容承载着更加丰富与直观的信息，能够更好地描述新闻事件，且更易广泛传播。研究表明，带图片流量媒体的平均转发次数是纯文本的11倍。正因如此，虚假的新闻或谣言经常使用极具煽动性的图片来吸引和误导读者，从而快速且广泛地传播，这使得对视觉模态内容的检测已经成为应对网络谣言挑战的不容忽视的一部分。传统的基于视觉模态内容进行虚假内容检测的工作主要是利用传统的手工特征，如视觉清晰度、视觉相似度直方图、双重JPEG压缩痕迹等，这些手段往往对粗糙的图片篡改有很好的效果，但随着生成图片技术不断提高，这些方法在不能保证精度的同时也显著提高了资源成本要求。近年来，随着神经网络和深度学习模型的快速发展，相应的检测技术应运而生并取得了巨...

【技术保护点】
1.一种基于多模态关系的网络谣言检测方法，其特征在于，包括：/n获取网络平台上发布的待检测的信息，包括图像以及相关的文本；/n对于图像，通过预训练的fasterR-CNN模型提取出图像中包含不同类别物体的视觉特征向量；/n对于文本，进行预处理后，通过门控循环单元进行语义向量的提取；/n通过注意力机制，捕捉视觉特征向量与语义向量的重要程度，并实现图像与文本之间跨模态关联，从而更新视觉特征向量与语义向量；并且，基于更新后的视觉特征向量与语义向量，通过注意力机制各自建模内部动态信息的关系，从而再次更新视觉特征向量与语义向量；将再次更新得到的视觉特征向量与语义向量连接在一起，再通过一个二分类器，获得待检测的信息为谣言类别与真实类别的概率。/n

【技术特征摘要】
20191225 CN 201911357589X1.一种基于多模态关系的网络谣言检测方法，其特征在于，包括：
获取网络平台上发布的待检测的信息，包括图像以及相关的文本；
对于图像，通过预训练的fasterR-CNN模型提取出图像中包含不同类别物体的视觉特征向量；
对于文本，进行预处理后，通过门控循环单元进行语义向量的提取；
通过注意力机制，捕捉视觉特征向量与语义向量的重要程度，并实现图像与文本之间跨模态关联，从而更新视觉特征向量与语义向量；并且，基于更新后的视觉特征向量与语义向量，通过注意力机制各自建模内部动态信息的关系，从而再次更新视觉特征向量与语义向量；将再次更新得到的视觉特征向量与语义向量连接在一起，再通过一个二分类器，获得待检测的信息为谣言类别与真实类别的概率。

2.根据权利要求1所述的一种基于多模态关系的网络谣言检测方法，其特征在于，包含不同类别物体的视觉特征向量表示为V＝{v1,v2,…,vK}，其中，vi代表一个物体的视特征向量，K表示特征向量总数目，i＝1,2,…,K。

3.根据权利要求1所述的一种基于多模态关系的网络谣言检测方法，其特征在于，所述的相关的文本包括：待检测的信息所包含的文本、以及其他用户转发该待检测的信息时附带的文本。

4.根据权利要求2所述的一种基于多模态关系的网络谣言检测方法，其特征在于，对文本进行预处理包括：去除文本中的冗余信息，仅保留文字信息，再拼接为文本序列，拼接间隙使用分隔符作为标识；所述冗余信息至少包括如下信息的一种或多种：符号表情、特殊字符、统一资源定位符。

5.根据权利要求1所述的一种基于多模态关系的网络谣言检测方法，其特征在于，通过门控循环单元进行语义向量的提取之前，使用预训练的GLOVE进行词特征的向量化，将预处理后的文本表示为矩阵形式，再使用门控循环单元进行特征提取，从而得到语义向量。

6.根据权利要求1所述的一种基于多模态关系的网络谣言检测方法，其特征在于，所述通过注意力机制，捕捉视觉特征向量与语义向量的重要程度，并实现图像与文本之间跨模态关联，从而更新视觉特征向量与语义向量包括：
视觉特征向量与语义向量各自作为一个模态信息，通过注意力机制提取每一个(视觉特征向量，语义向量)对的重要程度，根据重要程度实现不同模态信息之间流动，以更新各模态信息，通过信息流动过程来实现图像与文本之间跨模态关联；操作过程如下：
对视觉特征向量与语义向量分别进行线性变换，得到注意力机制所需的k...

【专利技术属性】
技术研发人员：张勇东，毛震东，邓旭冉，赵博文，
申请(专利权)人：北京中科研究院，中国科学技术大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人