【技术实现步骤摘要】
本专利技术属于多媒体分析,特别是涉及一种基于多视角对比学习的多模态媒体篡改检测方法、系统、设备及介质。
技术介绍
1、随着生成模型的进步,能够生成高度逼真的假内容,导致多模态媒体篡改(dgm4)问题日益严重。现有方法通常通过对比学习对原始图像-文本对进行对齐,并使用交叉编码器聚合图像和文本模态的信息进行检测和定位。然而,这些方法存在以下两个主要问题:
2、1.篡改分布分散(dispersed manipulation distribution,dmd):由于将所有类型的篡改视为单一类别,导致篡改样本在特征空间中分布分散,难以有效区分不同类型的篡改。
3、2.噪声干扰混淆(noise interference confusion,nic):数据中的噪声和细微的篡改痕迹混合,导致模型误将原始样本分类为被篡改样本,降低了分类的准确性。
技术实现思路
1、本专利技术的目的是提供一种基于多视角对比学习的多模态媒体篡改检测方法、系统、设备及介质,以解决上述现有技术存在的问题。<
...【技术保护点】
1.一种基于多视角对比学习的多模态媒体篡改检测方法,其特征在于,包括:
2.根据权利要求1所述的一种基于多视角对比学习的多模态媒体篡改检测方法,其特征在于,所述基于所述训练数据集对所述初始多视角对比学习框架进行训练,具体包括:
3.根据权利要求2所述的一种基于多视角对比学习的多模态媒体篡改检测方法,其特征在于,根据所述噪声增强对齐学习损失进行训练的过程,具体包括:
4.根据权利要求2所述的一种基于多视角对比学习的多模态媒体篡改检测方法,其特征在于,根据所述多标签对比学习损失进行训练的过程,具体包括:
5.根据权利要求2所
...【技术特征摘要】
1.一种基于多视角对比学习的多模态媒体篡改检测方法,其特征在于,包括:
2.根据权利要求1所述的一种基于多视角对比学习的多模态媒体篡改检测方法,其特征在于,所述基于所述训练数据集对所述初始多视角对比学习框架进行训练,具体包括:
3.根据权利要求2所述的一种基于多视角对比学习的多模态媒体篡改检测方法,其特征在于,根据所述噪声增强对齐学习损失进行训练的过程,具体包括:
4.根据权利要求2所述的一种基于多视角对比学习的多模态媒体篡改检测方法,其特征在于,根据所述多标签对比学习损失进行训练的过程,具体包括:
5.根据权利要求2所述的一种基于多视角...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。