一种人脸伪造图像检测方法、装置、终端及存储介质制造方法及图纸

技术编号：36358149 阅读：52 留言：0更新日期：2023-01-14 18:15

本发明专利技术提供了一种人脸伪造图像检测方法、装置、终端及存储介质，其中方法包括获取人脸的RGB彩色图像；将所述RGB彩色图像颜色空间域的RGB特征x使用二维离散余弦变换转换到频率域X；计算所述频率域X的掩码矩阵M；将所述掩码矩阵M与所述频率域X相乘得到高频分量X

全部详细技术资料下载

【技术实现步骤摘要】
一种人脸伪造图像检测方法、装置、终端及存储介质

[0001]本专利技术属于图像识别领域，尤其是涉及一种人脸伪造图像检测方法、装置、终端及存储介质。

技术介绍

[0002]人脸伪造图像检测算法有很多种，其中较为常见的有改进神经网络模型和利用多模态特征融合两种。改进神经网络模型通常采用注意力机制对神经网络模型进行修改达到更好的检测精度，其存在的问题是改进后的模型可能只在训练的数据分布上表现良好，当用于未知的伪造操作数据集上时，效果不佳。基于多模态的伪造检测算法融合了多个模态的信息，当其中一个模态失效，还有其他模态进行补充，实现更好的泛化性。多个模态相互作用，往往也能使检测精度更高。现有多模态人脸伪造图像检测的研究重点是模态的选择和多个模态的有效融合，该领域通常把RGB特征之外的其他特征也当做一种模态。目前，基于多模态的人脸伪造图像检测算法有很多种，该多模态涉及频率域、图像深度或者心跳、血液流动等，其中使用最多的模态是频率域信息。
[0003]其中上采样是人脸伪造图像中常见操作，多应用于deepfake(深度伪造)和全脸合成中，在2020年，相关技术人员发现上采样操作会在频率域中留下棋盘阵列的高频伪影，而真实相机拍摄的图像的高频信息只存在于图像的角落。受奇异的棋盘阵列频率的启发，相关技术人员提出了双分支网络F3
‑
Net，该模型的一个分支通过频率感知图像分解来学习细微的伪造模式，另一个分支是从局部频率统计中提取高层语义来描述真实人脸和伪造人脸之间的频率感知统计差异。这两个分支通过一个名为MixBl...

【技术保护点】

【技术特征摘要】
1.一种人脸伪造图像检测方法，其特征在于，包括：获取人脸的RGB彩色图像；将所述RGB彩色图像颜色空间域的RGB特征x使用二维离散余弦变换转换到频率域X；计算所述频率域X的掩码矩阵M；将所述掩码矩阵M与所述频率域X相乘得到高频分量X
’
；将高频分量X
’
使用二维逆离散余弦变换转换到颜色空间域，得到高频边缘特征Y；将所述高频边缘特征Y和RGB特征x分别使用空间注意力机制得到注意力图，并利用注意力图将高频边缘特征与RGB特征进行融合，得到融合特征I；将所述融合特征I输入训练完成的图像分类网络；获取所述图像分类网络输出的识别结果。2.根据权利要求1所述的方法，其特征在于，所述将所述RGB彩色图像颜色空间域的RGB特征x使用二维离散余弦变换转换到频率域X，包括：获取所述RGB彩色图像颜色空间域的RGB特征x；其中，RGB彩色图像为正方形；对RGB特征x进行二维离散余弦变换，得到频率域X，公式如下所示：，其中，X(k,l)为二维离散余弦变换后的对应k行j列频谱系数，x(m,n)表示m行n列的像素值；C(k)和C (l)为补偿系数，公式如下所示：，其中，N为RGB彩色图像的宽度或高度，k为频谱图像的行坐标，l为频谱图像的列坐标，m为原RGB彩色图像的行坐标，n为原RGB彩色图像的列坐标。3.根据权利要求1所述的方法，其特征在于，所述计算所述频率域X的掩码矩阵M，公式如下所示：，其中，N为图像的宽度或高度，m为原RGB彩色图像的行坐标，n为原RGB彩色图像的列坐标，M（m，n）表示掩码矩阵，m，n的范围均为0至N
‑
1。4.根据权利要求1所述的方法，其特征在于，所述将...

【专利技术属性】
技术研发人员：王波，王伟，国英龙，徐振宇，程丽丽，杨巨成，刘建征，赵青，
申请(专利权)人：思腾合力天津科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人