基于多先验融合策略的图像伪造定位方法、介质及系统技术方案

技术编号:38274689 阅读:10 留言:0更新日期:2023-07-27 10:27
本发明专利技术请求保护一种基于多先验融合策略的图像伪造定位方法、介质及系统,涉及数字图像处理、计算机视觉、机器学习等技术领域。具体步骤为:1)为了制作伪造数据集,收集现有领域中真实图像和对应的区域掩码的数据集;2)利用收集的真实图像和掩码通过算法制作伪造数据集。为了进一步提升深度学习模型泛化性,按照原始图像质量不同,制作了三种类型的伪造数据集;3)利用制作的三个伪造数据集,对编码器解码器结构的深度学习模型进行训练;4)同时为了进一步增强深度学习的泛化性伪造定位能力,使用多先验融合策略进行训练。5)利用训练得到的深度学习模型对测试的篡改图像进行伪造区域定位。模型可以对现实中的篡改图像进行检测和定位。定位。定位。

【技术实现步骤摘要】
基于多先验融合策略的图像伪造定位方法、介质及系统


[0001]本专利技术涉及数字图像伪造检测与定位方法,属于数字图像处理、计算机视觉、机器学习等


技术介绍

[0002]随着信息技术的日益发展,数字图像已经成为信息存储和传播的重要载体。现今,数码相机和手机已经成为人们生活中非常普遍的电子产品,人们可以方便地拍摄照片并进行存储。与此同时,社交网络的普及和高速网络的普及,人们可以很轻松的在网络上分享和传播自己的图片,数字图像已经成为人们日常生活中不可或缺的重要组成部分。数字图像的广泛应用不仅在个人日常生活中,也在工业、医学、科学等领域中得到了广泛的应用,因此数字图像技术的发展也日益成为了研究的热点。中国有句古话:“耳听为虚,眼见为实。”然而,随着一些图像编辑软件被开发出来,例如Photoshop、GIMP等。这些图像编辑软件往往具有用户界面易操作的特点,人们可以很轻松地利用图像编辑软件对图像进行各种各样的伪造。伪造图像通常会扭曲原始图像的内容,人眼往往很难分辨出来,给人们传递虚假的信息,这会造成各种负面的社会影响。根据伪造图像的语义内容是否发生变化,图像伪造可以分为两种类型:图像全局伪造和图像局部伪造。其中图像全局伪造是通过一些图像处理(例如图像对比度增强,图像直方图均衡化)的方法,图像的全局内容进行操作,改变图像的视觉效果,这一过程并不会改变图像的语义内容信息。图像局部伪造是通过一些方式将一幅图像的局部内容进行改变。这种局部伪造的图像出现了原本不存在的语义内容,可以向人们传递虚假的信息,所以存在更大的潜在性安全风险,可能会造成更大的负面影响。针对图像局部伪造,按照伪造方式的不同可以分为三类:图像拼接伪造(Splicing),图像复制粘贴伪造(Copy

Move),图像删除伪造(Removal)。不同的伪造方式有各自的特点,会造成不同的负面影响。随着深度学习技术的发展,越来越多的研究人员通过深度学习技术进行图像伪造检测。事实上,深度学习技术已经成为目前图像取证研究最有效的方式。随着深度学习技术的发展,研究人员逐渐关注深度学习模型的泛化性检测定位能力,即深度学习可以检测未参与训练的伪造样本,这更具有现实意义。此外,将伪造图像的伪造内容进行定位,给出明确的伪造区域,可以让人们更好的分辨。
[0003]随着人工智能相关技术的日益发展,通过深度学习进行图像伪造检测已经成为当前乃至未来最重要的途径,同时深度学习技术也被证明了具有很强的性能。针对使用深度学习技术进行图像伪造检测的方法,按照训练类别和测试类别的不同可以分为两类:针对特定伪造类型的方法和针对多种伪造类型的方法。目前的方法往往无法检测未参与训练的数据集,也就是模型缺乏泛化性检测和定位能力。
[0004]CN114677332A,一种基于JPEG指纹的深度特征融合图像篡改检测方法,涉及数字图像处理、计算机视觉、深度学习等
具体步骤为:1)搜集并整理公开的未压缩的图像样本;2)对图像样本进行两种方式篡改并标注获得篡改图像样本以及标签以完成图像篡改数据集的构建;3)利用制作的图像篡改数据集对深度特征融合网络进行训练;4)利用
训练得到的模型对两种篡改图像进行测试,得到最终效果。本方法利用特征融合卷积神经网络训练得到的模型可以对现实中的篡改图像进行检测,具有实际意义,并且取得较好的检测精度。
[0005]缺陷1:过于依赖JPEG格式的图像,当伪造图像是其它格式的时候失效。
[0006]解决1:制作了3类数据集,提供了更多的先验信息,更符合现实世界问题。
[0007]缺陷2:对JEPG的压缩因子QF敏感
[0008]解决2:不依赖与某一具体的因素,更加简单有效。
[0009]缺陷3:需收集未压缩的图像进行制作伪造数据集
[0010]解决3:对真实图像没有过多限制。
[0011]缺陷4:两种篡改图像混合训练模型,特征之间可能相互干扰,无法拟合效果最优的模型。
[0012]解决4:使用多先验融合策略进行训练,避免了盲目的混合训练带来的问题。

技术实现思路

[0013]本专利技术旨在解决现有的图像伪造检测方法中存在的问题。本专利技术通过制作不同原始图像质量的伪造数据集,模拟现实世界中各种图像质量情况。为了避免直接混合训练导致特征之间的相互干扰,使用一种多先验融合策略进行训练,这样模型可以具有更好的泛化性检测能力。本专利技术的技术方案如下:
[0014]一种基于多先验融合策略的图像伪造定位方法,其包括以下步骤:
[0015](1)获取公开的真实原始图像和区域对应掩码样本;
[0016](2)对获取到的真实原始图像和区域对应掩码样本使用python编写的图像局部伪造算法进行制作伪造数据集;按照原始图像质量不同,制作了三个图像伪造数据集,分别称为Set_ori,Set_jpeg,Set_blur;
[0017](3)利用步骤(2)制作的三个伪造数据集,对编码器解码器结构的深度学习模型进行训练;
[0018](4)对步骤(3)的深度学习模型,使用多先验融合策略进行训练;
[0019](5)利用步骤(4)训练得到的模型对输入的图像进行测试,得到最终的伪造定位的结果,以一种二进制掩码展示,白色区域代表伪造区域,黑色区域代表真实区域。
[0020]进一步的,所述步骤(1)获取公开的真实原始图像和区域对应掩码样本,具体包括:
[0021]使用COCO数据集和相应的二进制掩码制作了伪造数据集;首先解析COCO2017的验证集,并生成与图像某一个物体对应的二进制掩码,去除那些物体区域太大(>50%)和区域太小(<5%)的图像;然后从剩余的图像中,随机选择4000张原始图像和物体相应掩码。
[0022]进一步的,所述步骤(2)按照原始图像质量不同,制作了三个图像伪造数据集,具体包括:
[0023]制作了3种类型的伪造数据集,每个数据集的原始图像都来自于相同的4000张图像,区别是在进行伪造过程之前的操作;直接对原始图像进行伪造得到的数据集称为Set_ori;先对原始图像进行随机高斯模糊处理,再进行伪造得到的数据集称为Set_blur;先对原始图像进行随机JPEG压缩处理,再进行伪造得到的数据集称为Set_jpeg。
[0024]进一步的,所述步骤(2)图像伪造具体过程通过算法进行实现,首先根据真实物体的掩码生成伪造物体的掩码,随后生成伪造图像,如下面公式所示:
[0025][0026]其中M
fake
表示伪造图像对应的二进制掩码,I
fake
指的是最终被伪造的图像;I
real
为MSCOCO真实原始图像,mask为I
real
的真实物体对应二进制掩码,mask2表示与原始图像大小相同所有像素值均为0的图像;Box(
·
)表示计算裁剪物体区域的最大轮廓边界框;此操作就是将物体裁剪出来,同时避免存在过多冗余像素;本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多先验融合策略的图像伪造定位方法,其特征在于,包括以下步骤:(1)获取公开的真实原始图像和区域对应掩码样本;(2)对获取到的真实原始图像和区域对应掩码样本使用python编写的图像局部伪造算法进行制作伪造数据集;按照原始图像质量不同,制作了三个图像伪造数据集,分别称为Set_ori,Set_jpeg,Set_blur;(3)利用步骤(2)制作的三个伪造数据集,对编码器解码器结构的深度学习模型进行训练;(4)对步骤(3)的深度学习模型,使用多先验融合策略进行训练;(5)利用步骤(4)训练得到的模型对输入的图像进行测试,得到最终的伪造定位的结果,以一种二进制掩码展示,白色区域代表伪造区域,黑色区域代表真实区域。2.根据权利要求1所述的基于多先验融合策略的图像伪造定位方法,其特征在于,所述步骤(1)获取公开的真实原始图像和区域对应掩码样本,具体包括:使用COCO数据集和相应的二进制掩码制作了伪造数据集;首先解析COCO2017的验证集,并生成与图像某一个物体对应的二进制掩码,去除那些物体区域太大(>50%)和区域太小(<5%)的图像;然后从剩余的图像中,随机选择4000张原始图像和物体相应掩码。3.根据权利要求1所述的基于多先验融合策略的图像伪造定位方法,其特征在于,所述步骤(2)按照原始图像质量不同,制作了三个图像伪造数据集,具体包括:制作了3种类型的伪造数据集,每个数据集的原始图像都来自于相同的4000张图像,区别是在进行伪造过程之前的操作;直接对原始图像进行伪造得到的数据集称为Set_ori;先对原始图像进行随机高斯模糊处理,再进行伪造得到的数据集称为Set_blur;先对原始图像进行随机JPEG压缩处理,再进行伪造得到的数据集称为Set_jpeg。4.根据权利要求2或3所述的基于多先验融合策略的图像伪造定位方法,其特征在于,所述步骤(2)图像伪造具体过程通过算法进行实现,首先根据真实物体的掩码生成伪造物体的掩码,随后生成伪造图像,如下面公式所示:体的掩码,随后生成伪造图像,如下面公式所示:其中M
fake
表示伪造图像对应的二进制掩码,I
fake
指的是最终被伪造的图像;I
real
为MSCOCO真实原始图像,mask为I
real
的真实物体对应二进制掩码,mask2表示与原始图像大小相同所有像素值均为0的图像;Box(
·
)表示计算裁剪物体区域的最大轮廓边界框;此操作就是将物体裁剪出来,同时避免存在过多冗余像素;T(
·
)表示随机大小变换;表示将前者随机位置粘贴到后者之中;另外T(
·
)和在制作伪造掩码和伪造图像的公式中的操作完全相同,从而确保伪造图像和伪造区域二进制掩码精确对应。5.根据权利要求4所述的基于多先验融合策略的图像伪造定位方法,其特征在于,所述步骤(3)利用步...

【专利技术属性】
技术研发人员:毕秀丽单长喜刘波肖斌
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1