双注意力机制高频信息感知的深度伪造检测方法和系统技术方案

技术编号:37441731 阅读:17 留言:0更新日期:2023-05-06 09:13
公开了双注意力机制高频信息感知的深度伪造检测方法和系统,包括利用主干网络的四个残差卷积块进行特征提取,四个残差卷积块分别为Stage1、Stage2、Stage3和Stage4;利用空间

【技术实现步骤摘要】
双注意力机制高频信息感知的深度伪造检测方法和系统


[0001]本专利技术涉及图像检测的
,尤其是双注意力机制高频信息感知的深度伪造检测方法和系统。

技术介绍

[0002]随着深度学习技术的迅速发展,生成对抗网络能生成高质量的伪造人脸图像。然而,这项技术可能会被不法分子所使用,造成社会出现严重的信息泄露问题。为了避免因伪造人脸造成的信息泄露问题,深度伪造人脸检测技术得到许多的关注。现有算法主要以RGB图像作为卷积神经网络(例如,ResNet50或者Inception)的输入,提取人脸图像的高层语义特征,来判别该输入的图像是否为伪造人脸。
[0003]目前,深度伪造人脸检测算法以卷积神经网络为主要框架,提取人脸图像中的高频信息和低频信息,高频信息存在于图像边缘处,低频信息主要是存在于人脸像素平缓区域。卷积神经网络能很好的保留低频信息,并逐渐转换为高级的语义信息。然而,高频信息会因为网络层数和反向传播等问题,导致梯度信息逐渐消失,无法起到参数更新的作用。
[0004]人脸RGB图像分为高频信息和低频信息,低频信息定义为图像强度变换平缓的像素点,高频图像定义为图像强度变化剧烈的像素点。在伪造人脸中,伪造区域的边缘像素通常变化明显,对于非伪造区域的像素较为平缓。卷积神经网络利用层数的不断加深来提取高层语义信息,使得特征更具区分力。然而,高层语义信息更多是由低频信息转化而来,随着网络层数的加深,高频信息通常被忽略。高频信息更多是因伪造而导致的像素剧烈变化,因此,让卷积神经网络尽可能保留高频信息是提升深度伪造图像检测方法的关键。

技术实现思路

[0005]为了解决现有技术中存在的上述技术问题,本专利技术提出了一种双注意力机制高频信息感知的深度伪造检测方法和系统,以解决上述技术问题。
[0006]根据本专利技术的一个方面,提出了双注意力机制高频信息感知的深度伪造检测方法,包括:
[0007]S1:利用主干网络的四个残差卷积块进行特征提取,四个残差卷积块分别为Stage1、Stage2、Stage3和Stage4;
[0008]S2:利用空间

通道信息增强模块来进行特征重建与增强,将空间

通道信息增强模块输出的特征与第i个Stage的输出特征进行通道级联后送入第i+1个Stage;
[0009]S3:利用标签平滑正则化的交叉嫡损失函数进行约束。
[0010]在一些具体的实施例中,空间

通道信息增强模块中通道信息增强模块的表达式如下:F
Ci
=σ(f1(R(f2(GAP(F
i
))))),其中,F
i
定义为第i个Stage的输出特征,σ定义为Sigmoid激活函数,R定义为ReLU激活函数,GAP定义为全局平均池化,f1和f2定义为不同的全连接层,F
CCi
定义为通道信息增强模块最后的特征输出。
[0011]在一些具体的实施例中,空间

通道信息增强模块中空间信息增强模块的表达式
如下:F
SSi
=σ(C(F
i
)),其中,C定义为1*1卷积层,F
SSi
定义为空间信息增强模块的特征输出。
[0012]在一些具体的实施例中,整个空间

通道信息增强模块的特征输出定义为通道信息增强模块的特征输出定义为
[0013]在一些具体的实施例中,级联后的特征引入1*1卷积将通道降为原来的1/2。
[0014]在一些具体的实施例中,标签平滑正则化的交叉嫡损失函数具体为:其中,ε∈[0,1],K表示人脸的类别数,p(k)表示预测属于类别k的概率。
[0015]根据本专利技术的第二方面,提出了一种计算机可读存储介质,其上存储有一或多个计算机程序,该一或多个计算机程序被计算机处理器执行时实施上述任一项的方法。
[0016]根据本专利技术的第三方面,提出了双注意力机制高频信息感知的深度伪造检测系统,系统包括:
[0017]特征提取单元,配置用于利用主干网络的四个残差卷积块进行特征提取,四个残差卷积块分别为Stage1、Stage2、Stage3和Stage4;
[0018]特征增强单元,配置用于利用空间

通道信息增强模块来进行特征重建与增强,将空间

通道信息增强模块输出的特征与第i个Stage的输出特征进行通道级联后送入第i+1个Stage;
[0019]约束单元:配置用于利用标签平滑正则化的交叉嫡损失函数进行约束。
[0020]在一些具体的实施例中,空间

通道信息增强模块中通道信息增强模块的表达式如下:F
Ci
=σ(f1(R(f2(GAP(F
i
))))),其中,F
i
定义为第i个Stage的输出特征,σ定义为Sigmoid激活函数,R定义为ReLU激活函数,GAP定义为全局平均池化,f1和f2定义为不同的全连接层,F
CCi
定义为通道信息增强模块最后的特征输出。
[0021]在一些具体的实施例中,空间

通道信息增强模块中空间信息增强模块的表达式如下:F
SSi
=σ(C(F
i
)),其中,C定义为1*1卷积层,F
SSi
定义为空间信息增强模块的特征输出;整个空间

通道信息增强模块的特征输出定义为
[0022]在一些具体的实施例中,级联后的特征引入1*1卷积将通道降为原来的1/2。
[0023]在一些具体的实施例中,标签平滑正则化的交叉嫡损失函数具体为:其中,ε∈[0,1],K表示人脸的类别数,p(k)表示预测属于类别k的概率。
[0024]本专利技术提出一种双注意力机制高频信息感知的深度伪造图像检测方法,利用双注意力机制来增强高频信息的表达,通过增强反向传播对浅层卷积块的参数更新,从而提升高频信息对网络训练的影响。本专利技术在不影响网络对低频信息的提取,同时增加网络对高频信息的获取,使得网络对低频和高频信息都具有较强的表征能力。本专利技术提出的双注意力机制只用于训练阶段,在增加少量参数的情况下,可以提升网络的准确率。
附图说明
[0025]包括附图以提供对实施例的进一步理解并且附图被并入本说明书中并且构成本说明书的一部分。附图图示了实施例并且与描述一起用于解释本专利技术的原理。将容易认识到其它实施例和实施例的很多预期优点,因为通过引用以下详细描述,它们变得被更好地
理解。通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
[0026]图1是本申请的一个实施例的双注意力机制高频信息感知的深度伪造检测方法的流程图;
[0027]图2是本申请的一个具体的实施例的双注意力机制高频信息感知的深度伪造检测方法的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.双注意力机制高频信息感知的深度伪造检测方法,其特征在于,包括:S1:利用主干网络的四个残差卷积块进行特征提取,四个残差卷积块分别为Stage1、Stage2、Stage3和Stage4;S2:利用空间

通道信息增强模块来进行特征重建与增强,将所述空间

通道信息增强模块输出的特征与第i个Stage的输出特征进行通道级联后送入第i+1个Stage;S3:利用标签平滑正则化的交叉嫡损失函数进行约束。2.根据权利要求1所述的双注意力机制高频信息感知的深度伪造检测方法,其特征在于,所述空间

通道信息增强模块中通道信息增强模块的表达式如下:F
Ci
=σ(f1(R(f2(GAP(F
i
))))),其中,F
i
定义为第i个Stage的输出特征,σ定义为Sigmoid激活函数,R定义为ReLU激活函数,GAP定义为全局平均池化,f1和f2定义为不同的全连接层,F
CCi
定义为通道信息增强模块最后的特征输出。3.根据权利要求2所述的双注意力机制高频信息感知的深度伪造检测方法,其特征在于,所述空间

通道信息增强模块中空间信息增强模块的表达式如下:F
SSi
=σ(C(F
i
)),其中,C定义为1*1卷积层,F
SSi
定义为空间信息增强模块的特征输出。4.根据权利要求3所述的双注意力机制高频信息感知的深度伪造检测方法,其特征在于,整个所述空间

通道信息增强模块的特征输出定义为5.根据权利要求1所述的双注意力机制高频信息感知的深度伪造检测方法,其特征在于,级联后的特征引入1*1卷积将通道降为原来的1/2。6.根据权利要求1所述的双注意力机制高频信息感知的深度伪造检测方法,其特征在于,所述标签平滑正则化的交叉嫡损失函数具体为:于,所述标签平滑正则化的交叉嫡损失函数具体为:其中,ε∈[0,1],K表示人脸的类别数,p(k)表示预测属于类别k的概率。7.一种计算机可读存储介质,其上存储有一或多个计算机程序,其特征在于,该一或...

【专利技术属性】
技术研发人员:洪雅婷吴俊毅陈绍东梁素敏李彤馨滕凯文
申请(专利权)人:厦门市美亚柏科信息股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1