基于多视图知识集成和频率一致性的人脸跨域翻译方法技术

技术编号：39008042 阅读：7 留言：0更新日期：2023-10-07 10:39

本发明专利技术公开一种基于多视图知识集成和频率一致性的人脸跨域翻译方法，将大型单域数据中的人脸知识共同引入到有限的跨域数据中。具体来说，一边将输入照片通过人脸解析网络提取特征后，级联至基于多视图知识集成模型的翻译网络中。另一边输入照片通过人脸识别网络提取人脸身份特征，级联后的特征与人脸身份特征计算KL损失从而起到身份一致监督，以增强生成的图像和真实图像之间的高低频率一致性。提出的频率一致性损失是一种通用的重建损失，可以灵活地应用于其他生成模型，提高模型对噪声的鲁棒性。棒性。棒性。

全部详细技术资料下载

【技术实现步骤摘要】
基于多视图知识集成和频率一致性的人脸跨域翻译方法

[0001]本专利技术属于计算机视觉
，尤其涉及基于多视图知识集成和频率一致性的人脸跨域翻译方法。

技术介绍

[0002]人脸跨域翻译的目的是在不同领域之间翻译人脸图像，包括人脸照片与素描，照片与线条画，以及近红外(NIR)与可见光(VIS)。它可以应用于各种场景，从执法到数字娱乐，近期已经引起了广泛关注。艺术肖像线条画(APDrawings)由稀疏的线条组成，用于构建人脸粗糙的结构信息。此外，人脸照片
‑
素描/照片
‑
线条画的翻译也被证明可以提高动画制作的效率，或者为没有经过专业绘画训练的人在社交平台上提供个性化的头像。此外，NIR
‑
VIS人脸图像翻译被广泛用于提高门禁系统的安全性。近红外相机捕捉反射的近红外光，不受可见光条件的影响，而可见光相机深深地依赖于光线条件，在弱光或暗光条件下，很容易产生低质量的图像，纹理模糊。然而，由于存在明显的风格域差异，很难将近红外图像与公民人脸数据库的图像直接匹配。人脸NIR
‑
VIS翻译可以弥补这一不足，提高人脸识别的准确性。
[0003]跨域人脸翻译的方法可以分为两类：基于样本的方法和基于GAN的方法。基于样本的方法通过将人脸图像裁剪成图像块并将图像级的翻译任务简化为图像块级，从而增加了训练数据。输出图像是通过用一组重建系数对图像块进行加权来重建的。然而，这些方法很耗时，并会产生模糊或过度平滑的结构，RSLCR通过随机采样和局部约束加速了人脸...

【技术保护点】

【技术特征摘要】
1.一种基于多视图知识集成和频率一致性的人脸跨域翻译方法，其特征在于，多视图知识集成模型包括结构模块、身份模块和翻译网络T；翻译网络T包括在风格域X和风格域Y之间的两个映射，即T
y
：X
→
Y和T
x
:Y
→
X；翻译网络T采用了编码器
‑
解码器架构，以9个残差块为骨干网络；在训练阶段，通过表示将图像从源域映射到目标域基本的生成约束：其中x和y分别表示风格域X和风格域Y中的一个样本，由翻译网络T
y
输入x生成，而由翻译网络T
x
输入y生成；此外，通过循环一致性损失激励x
rec
＝x,y
rec
＝y,其中x
rec
是由翻译网络T
x
输入生成，y
rec
是由翻译网络T
y
输入生成：在多视图知识集成模型中，两个判别器D
x
和D
y
分别服务于翻译网络T
y
和翻译网络T
x
，对抗损失表示为：其中表示期望，T
y
企图去生成更真实的图像T
y
(x)，D
y
关注于区分真实图像y和生成的图像T
y
(x)；相应地，T
x
企图去生成更真实的图像T
x
(y)，D
x
关注于区分真实图像x和生成的图像T
x
(y)相反翻译方向的对抗损失表示为：完整的对抗损失为：最终，将翻译网络的目标表示如下：所述结构模块利用预训练的人脸解析网络去获得人脸成分掩膜作为先验知识，并训练从人脸成分掩膜到目标域图像的自编码器，通过级联结构知识f
S
和翻译网络的特征f
T
得到级联起来的特征f
S,T
，所述级联结构知识f
S
包括和翻译网络的特征f
T
包括和f
S,T
包括和结构模块能够向翻译网络提供结构知识，以降低不同人脸部件之间的混淆噪声并抑制每个人脸部件内的离群像素值；所述身份模块由预训练的人脸识别网络实现...

【专利技术属性】
技术研发人员：曹兵，王清和，朱鹏飞，胡清华，赵佳鸣，毕志伟，亓国梁，孙一铭，高毓聪，曹亚如，
申请(专利权)人：天津大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人