一种短视频信息检测方法、装置、设备及存储介质制造方法及图纸

技术编号:44484966 阅读:26 留言:0更新日期:2025-03-04 17:50
本发明专利技术公开了一种短视频信息检测方法、装置、设备及存储介质,涉及网络空间安全信息检测技术领域,包括以下步骤:获取目标短视频中的多模态信息,提取各模态信息对应的多个模态特征;将标题特征与其他模态特征分别进行特征对齐,得到与标题最相关的多个关键特征;分别对与标题最相关的多个关键特征之间的一致性进行建模,得到第一融合特征表示以及第二融合特征表示;将第一融合特征表示、第二融合特征表示和标题特征进行拼接,得到多模态融合特征;对多模态融合特征进行分类,得到目标短视频中多模态信息的检测结果。本方法基于特征对齐和语义一致性建模,更好地挖掘并融合了短视频中的关键信息,大幅提升了信息的检测结果的准确性。

【技术实现步骤摘要】

本专利技术涉及网络空间安全信息检测,特别是涉及一种短视频信息检测方法、装置、设备及存储介质


技术介绍

1、近年来,随着社会演变和网络发展,社交网络已成为“连接万物”的平台,其影响力也显著提升,促进了海量信息资源的广泛和快速传播。然而,社交网络的飞速发展也会导致网络环境中有害信息增加,不实信息就是其中一种,它通过虚构、夸大以及歪曲事实等手段来误导人们。短视频等社交平台中的不实信息问题已经十分严峻,如何快速且有效地自动检测出其中的不实信息已经成为一个亟待解决的重要问题和研究热点。

2、现有的信息检测方法大多基于文本、图像和社交上下文等信息,并使用深度学习模型提取特征进行检测。如wang等人提出的eann(event adversarial neural networks)模型在拼接特征的基础上使用辅助对抗网络学习事件的不变特征以提高检测的准确率,这类拼接方法的缺点是不能捕捉文本和图像之间的关系,无法充分理解和利用多模态信息。wu等人模拟人的阅读习惯,利用共同注意力机制融合提取到的文本特征、图像空域及频域特征,增强模态之间的信息理解。

本文档来自技高网...

【技术保护点】

1.一种短视频信息检测方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种短视频信息检测方法,其特征在于,所述多模态信息包括文本信息、视频帧序列和音频帧序列,所述文本信息包括标题和视频字幕;

3.如权利要求1所述的一种短视频信息检测方法,其特征在于,所述将标题特征与其他模态特征分别进行特征对齐,得到与标题最相关的多个关键特征,包括以下步骤:

4.如权利要求3所述的一种短视频信息检测方法,其特征在于,所述获取对应的多个跨模态注意力值,跨模态注意力值具体如下所示:

5.如权利要求2所述的一种短视频信息检测方法,其特征在于,所述分别对视频...

【技术特征摘要】

1.一种短视频信息检测方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种短视频信息检测方法,其特征在于,所述多模态信息包括文本信息、视频帧序列和音频帧序列,所述文本信息包括标题和视频字幕;

3.如权利要求1所述的一种短视频信息检测方法,其特征在于,所述将标题特征与其他模态特征分别进行特征对齐,得到与标题最相关的多个关键特征,包括以下步骤:

4.如权利要求3所述的一种短视频信息检测方法,其特征在于,所述获取对应的多个跨模态注意力值,跨模态注意力值具体如下所示:

5.如权利要求2所述的一种短视频信息检测方法,其特征在于,所述分别对视频帧关键特征和音频帧关键特征以及视频字幕关键特征和视频时空关键特征之间的一致性进行建模,得到视频帧和音频帧的第一融合特征表示以及视频字幕...

【专利技术属性】
技术研发人员:王震祁博涵井卫凯李晓宇高超李向华
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1