一种基于脸部区域注意力机制的深度图片鉴伪方法及系统技术方案

技术编号：34776091 阅读：11 留言：0更新日期：2022-08-31 19:48

本发明专利技术公开了一种基于脸部区域注意力机制的深度图片鉴伪方法及系统，对获取的人脸区域图片进行分割，得到多个不同脸部分割区域图片；将分割后得到的不同脸部分割区域图片与分割前原人脸区域图片进行合并；将合并的图片输入至带有注意力模型的注意力机制UNet网络对脸部像素进行分类，并输出加权后的人脸区域特征图后输入至预先训练好的鉴伪分类神经网络模型中输出图片鉴伪分类结果。通过添加人脸分割信息和带有注意力模型的注意力机制UNet网络进行预处理，实现人为预先告知模型不同的人脸分割区域很有可能是需要关注的地方，为分类网络提供更多信息，让基于人脸图片的造假鉴伪有更优的准确率和鲁棒性。有更优的准确率和鲁棒性。有更优的准确率和鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于脸部区域注意力机制的深度图片鉴伪方法及系统

[0001]本专利技术涉及人工智能
，具体涉及一种基于脸部区域注意力机制的深度图片鉴伪方法及系统。

技术介绍

[0002]近年来随着深度学习技术的迅猛发展和硬件设备特别是图形计算单元(GPU)成本的不断降低，人工智能技术在各个领域上都进行了快速渗透与落地应用。在深度神经网络CNN的催生下，对抗生成网络GAN利用了高维度空间映射理论学习某类图片的信息分布，对于人脸图片来说，就可以将一个低维随机向量生成一张自然逼真的人脸图片，甚至能生成一段不存在的人物视频，令人难辨真伪。GAN技术从2014年Goodfellow提出以来就受到学术界与工业界的大量关注，从分辨率较低的DCGAN、CGAN，到风格迁移Pixel2Pixel、CycleGAN，再到高分辨率大模型BigGAN、StyleGAN，大数据训练下的大模型达到的效果已经堪比真实拍摄出的图片。在这种情况下，将该技术滥用到图片与视频生成造成的社会风险也是巨大的。
[0003]随着生成技术的发展，图片和视频鉴伪算法也逐渐获得了重视，目前的鉴伪算法可以大体分为两类，一种是基于真实图片拍摄硬件设备在图片上留下的痕迹检测，另一种是基于生成算法在图片上产生的不协调检测。第一类算法很大程度上依赖于拍摄设备的特点，包括相机成像时使用的降噪、压缩、CFA去雾算法的选择，而这些都与相机的品牌和型号有关，在训练模型时需要特定设备的图像来训练神经网络，而相机品牌和型号之多是无法完全穷举的，所以这类方法具有较大的局限性；第二类算法是...

【技术保护点】

【技术特征摘要】
1.一种基于脸部区域注意力机制的深度图片鉴伪方法，其特征在于，所述方法包括：对待鉴别图片进行人脸检测，并将得到的人脸检测框按预设比例放大后剪裁出人脸区域图片；对获取的人脸区域图片进行分割，得到多个不同脸部分割区域图片；将分割后得到的不同脸部分割区域图片与分割前原人脸区域图片进行图像通道层合并；将合并的图片输入至带有注意力模型的注意力机制UNet网络对脸部像素进行分类，并输出加权后的人脸区域特征图后输入至预先训练好的鉴伪分类神经网络模型中输出图片鉴伪分类结果。2.根据权利要求1所述的一种基于脸部区域注意力机制的深度图片鉴伪方法，其特征在于，将得到的人脸检测框按预设比例放大后剪裁出人脸区域，具体包括：将人脸检测框向外扩大50％得到新的人脸检测框后裁剪出人脸区域。3.根据权利要求1所述的一种基于脸部区域注意力机制的深度图片鉴伪方法，其特征在于，对获取的人脸区域进行分割，得到多个不同脸部分割区域信息，具体包括：分割区域包括：头发、左眉毛、右眉毛、左瞳孔、右瞳孔、鼻子、上嘴唇、下嘴唇、口腔、左耳朵、右耳朵、脸皮肤以及脖子区域；每个区域都用一个H*W*1的数据块进行表示，属于该区域的像素值为1，不属于该区域的像素值为0，得到的13个部分组成了H*W*13的数据块，H是图片纵向的像素个数，W是横向的像素个数。4.根据权利要求3所述的一种基于脸部区域注意力机制的深度图片鉴伪方法，其特征在于，将得到的不同脸部分割区域信息与原人脸区域图片进行通道层合并，具体包括：将RGB三通道格式的原人脸图片H*W*3和对应脸部分割信息H*W*13在进行通道层合并，得到H*W*16的数据块。5.根据权利要求1所述的一种基于脸部区域注意力机制的深度图片鉴伪方法，其特征在于，所述注意力机制UNet网络包括UNet网络模型和注意力模型，所述UNet网络模型总体分为四层下采样和对应的四...

【专利技术属性】
技术研发人员：朱州，
申请(专利权)人：北京影数科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人