基于机器学习的伪造图像检测识别方法技术

技术编号:26172519 阅读:40 留言:0更新日期:2020-10-31 13:50
本发明专利技术公开一种基于机器学习的伪造图像检测识别方法,包括:首先、获取待检图像;然后、提取所述待检图像的图像特征,生成待检图像的特征向量;最后、根据特征向量,通过用于检测异常图像的机器学习算法检测待检图像是否是异常图像。同时,通过用于检测合成图像的机器学习算法检测待检图像是否是合成图像,如此不需要大量计算机资源和时间资源,就可以检测出伪造图像,检测效果好,而且可以确定伪造图像的类型,以便对伪造图像进行针对性处理。

【技术实现步骤摘要】
基于机器学习的伪造图像检测识别方法
本专利技术涉及应用电子设备进行识别的方法或装置领域,特别是涉及一种基于机器学习的伪造图像检测识别方法。
技术介绍
在这个科技发达的时代中,数码图像已成为人们生命中一个重要的部分,不论从个人娱乐用途或医学上都会使用到数码图像。在庞大的数码图像中,如何确认一个图像的真实性已成为很重要的问题之一。从医学的角度来说,伪造医用图像可以导致医生误诊一个病人的情况;而在政治方面上伪造图像可以使错误的信息被传播,由此可见检测伪造数码图像极其重要。伪造图像基本上可以分成三大类型:1)异常图像,即某个图像与其他大部分的图像的差异非常大;2)合成图像,即由电脑合成的图像;3)篡改图像,即把原本不存在的东西添加在某张图像中。现有检测伪造图像的技术包含两大方法,主动方法和被动方法。主动方法指的是在图像中加入一种数码水印,只要检测这个水印没有被干预或损坏就代表这个图像没有被修改过。这种基于主动方法的检测需要先对图像进行水印置入,而且需要确保原有的图像是没有被篡改过的,因此这种方法只能在完全确认图像的真实性才可以使用。被动方法是分析数码图像中的某种特征来判断这张图像是否是伪造。被动方法虽然实践起来会比主动方法更困难,但是在实际应用上因为无需图像的先验知识而显得更有优势。目前实现被动检测图像伪造的方法大多数是基于深度学习算法。虽然深度学习算法能检测图像是否属于伪造图像,但是训练一个深度学习模型所需的计算机和时间资源非常庞大,而且很难确定图像的伪造方式,即确定伪造图像是属于异常图像、合成图像、篡改图像或者是这几种类型的组合,因此难以针对图像的伪造方式对伪造图像进行相应处理。
技术实现思路
为解决以上技术问题,本专利技术提供一种基于机器学习的伪造图像检测识别方法,通过3种不同的机器学习算法,分别检测图像的异常、合成和篡改情况,以确定伪造图像,以及伪造图像所属类型。技术方案如下:提供了一种基于机器学习的伪造图像检测识别方法,在第一种可实现方式中,包括:获取待检图像;提取所述待检图像的图像特征,构建特征向量;根据特征向量,分别采用三种不同的机器学习算法检测所述待检图像,三种所述机器学习算法分别用于检测异常图像、合成图像和篡改图像。结合第一种可实现方式,在第二种可实现方式中,提取的图像特征包括所述待检图像的均值、标准差、偏度、峰度、能量、熵、光滑度。结合第二种可实现方式,在第三种可实现方式中,所述图像特征还包括:将所述待检图像划分成多个子图像后,每个子图像的均值、标准差、偏度、峰度、能量、熵、光滑度。结合第二或第三种可实现方式,在第四种可实现方式中,所述图像特征还包括:所述待检图像经过Gabor过滤器处理后,提取的均值、标准差、偏度、峰度。结合第一至四种可实现方式中的任意一种可实现方式,在第五种可实现方式中,采用稳鲁棒主成分分析算法检测所述异常图像。结合第一至五种可实现方式中的任意一种可实现方式,在第六种可实现方式中,采用支持向量机分类器检测所述合成图像。结合第一至六种可实现方式中的任意一种可实现方式,在第七种可实现方式中,采用随机森林分类器检测所述篡改图像。结合第一至七种可实现方式中的任意一种可实现方式,在第八种可实现方式中,还包括:将所述篡改图像分隔成N个a*a的像素块;计算每个像素块的噪声水平;基于噪声水平对所有像素块进行聚类;根据每个分类的像素块数量确定所述篡改图像的篡改部位。结合第八种可实现方式,在第九种可实现方式中,还包括:将每个n*n的像素块分割成M个m*m的子像素块;计算每个子像素块的噪声水平;根据每个像素块的噪声水平和每个子像素块的噪声水平,确定每个子像素块的最终噪声水平;基于最终噪声水平对所有子像素块进行聚类;根据每个分类的像素块数量确定所述篡改图像的篡改部位。结合第八或第九种可实现方式,在第十种可实现方式中,采用多类层次聚类算法进行聚类。有益效果:采用本专利技术的基于机器学习的伪造图像检测识别方法,不需要大量计算机资源和时间资源,就可以检测出伪造图像,检测效果好,而且可以确定伪造图像的类型,以便对伪造图像进行针对性处理。附图说明图1为本专利技术的检测方法流程图;图2为异常图像的检测方法流程图;图3为合成图像的检测方法流程图;图4为篡改图像的检测方法流程图;图5为定位篡改部分的流程图;图6为异常、合成和篡改总数据集分布分析结果示意图;图7为异常、合成和篡改总数据集性能指标示意图;图8为篡改定位结果示意图。具体实施方式下面结合实施例和附图对本专利技术作进一步说明。如图1所示的基于机器学习的伪造图像检测识别方法的流程图,该检测方法包括:步骤1、获取待检图像;步骤2、提取所述待检图像的图像特征,生成待检图像的特征向量;步骤3、根据特征向量,分别采用三种不同的机器学习算法检测所述待检图像,三种所述机器学习算法分别用于检测异常图像、合成图像和篡改图像。具体而言,在获取到待检图像后,可以将待检图像转换成灰度图像,并采用现有的双边过滤技术与对比度限制对灰度图像进行去噪和对比度增强处理,再从处理后的灰度图像中提取图像特征,生成与待检图像相对应的特征向量。最后,根据特征向量,可以通过用于检测异常图像的机器学习算法检测待检图像是否是异常图像。同时,可以通过用于检测合成图像的机器学习算法检测待检图像是否是合成图像,也可以通过用于检测篡改图像的机器学习方法检测待检图像是否为篡改图像。如此,可以确定伪造图像的伪造类型,而且,如果通过这三种机器学习算法都没有检测出待检图像不是异常、合成、伪造图像,则表明待检图像属于真实图像,并不是伪造图像。在本实施例中,优选的,提取的图像特征包括所述灰度图像的均值、标准差、偏度、峰度、能量、熵、光滑度,以及将所述待检图像的灰度图像划分成9个子图像后,提取的每个子图像的均值、标准差、偏度、峰度、能量、熵、光滑度。还有将所述灰度图像经过Gabor过滤器处理后,从处理后的过滤图像中提取的均值、标准差、偏度、峰度。在本实施例中,Gabor过滤器的核函数为:x′=xcosθ+ysinθ,y′=-xcosθ+ysinθ;λ为波长,θ为角度,ψ为相差,σ为高斯包的标准差,γ为空间纵横比,在本实施例中,λ=(2,2.5,3,3.5),θ=(0°,60°,120°,180°,240°,300°),通过调整核函数的参数可以得到24张不同的过滤图像。提取每张过滤图像的均值、标准差、偏度、峰度。结合从灰度图像、所有子图像和所有过滤图像提取到的特征,可以生成包括166个特征的特征向量。在本实施例中,优选的,如图2所示,采用鲁棒主成分分析算法检测所述异常图像,具体包括:步骤1-1、根据所述特征向量生成n×p的数据矩阵;...

【技术保护点】
1.一种基于机器学习的伪造图像检测识别方法,其特征在于,包括:/n获取待检图像;/n提取所述待检图像的图像特征,构建特征向量;/n根据特征向量,分别采用三种不同的机器学习算法检测所述待检图像,三种所述机器学习算法分别用于检测异常图像、合成图像和篡改图像。/n

【技术特征摘要】
1.一种基于机器学习的伪造图像检测识别方法,其特征在于,包括:
获取待检图像;
提取所述待检图像的图像特征,构建特征向量;
根据特征向量,分别采用三种不同的机器学习算法检测所述待检图像,三种所述机器学习算法分别用于检测异常图像、合成图像和篡改图像。


2.根据权利要求1所述的基于机器学习的伪造图像检测识别方法,其特征在于,提取的图像特征包括所述待检图像的均值、标准差、偏度、峰度、能量、熵、光滑度。


3.根据权利要求2所述的基于机器学习的伪造图像检测识别方法,其特征在于,所述图像特征还包括:将所述待检图像划分成多个子图像后,每个子图像的均值、标准差、偏度、峰度、能量、熵、光滑度。


4.根据权利要求2或3所述的基于机器学习的伪造图像检测识别方法,其特征在于,所述图像特征还包括:所述待检图像经过Gabor过滤器处理后,提取的均值、标准差、偏度、峰度。


5.根据权利要求1-4任一所述的基于机器学习的伪造图像检测识别方法,其特征在于,采用鲁棒主成分分析算法检测所述异常图像。


6.根据权利要求1-5任一所述的基于机...

【专利技术属性】
技术研发人员:郑国旋韩平畴
申请(专利权)人:江西中医药大学
类型:发明
国别省市:江西;36

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1