基于知识蒸馏的实时视频人脸卡通化方法、设备及介质技术

技术编号：34604823 阅读：63 留言：0更新日期：2022-08-20 09:08

本发明专利技术涉及一种基于知识蒸馏的实时视频人脸卡通化方法、设备及介质，该方法包括以下步骤：步骤S1、采用图像语义分割DeepLabv3+网络进行人像分割；步骤S2、通过特征提取模块提取人脸特征；步骤S3、采用Soft

全部详细技术资料下载

【技术实现步骤摘要】
基于知识蒸馏的实时视频人脸卡通化方法、设备及介质

[0001]本专利技术涉及人脸卡通化领域，尤其是涉及一种基于知识蒸馏的实时视频人脸卡通化方法、设备及介质。

技术介绍

[0002]卡通画一直以幽默、风趣的艺术效果和鲜明直接的表达方式为大众所喜爱。近年来，越来越多的人开始在社交网络中使用卡通画作为一种表意的文化载体。图像卡通风格渲染尤其是视频图像卡通风格渲染是一项具有挑战性的任务，其目的是将真实视频图像转换为卡通风格的非真实感图像，同时保持原视频图像的语义内容和纹理细节。
[0003]目前，视频卡通化任务的主要难点：
[0004]1)实时性不高：现有的方法大多针对图片卡通化；
[0005]2)数据获取难度大：绘制风格精美且统一的卡通画耗时较多、成本较高，且转换后的卡通画和原照片的脸型及五官形状有差异，因此不构成像素级的成对数据，难以采用基于成对数据的图像翻译(Paired Image Translation)方法。
[0006]3)照片卡通化后容易丢失身份信息：基于非成对数据的图像翻译(UnpairedI mage Translation)方法中的循环一致性损失(Cycle Loss)无法对输入输出的id进行有效约束。
[0007]深度神经网络因其较高的学习能力被应用到图像卡通风格渲染中，有着很高的优势，但是，这种方法通常难以在转换图像全局风格和保持图像局部的细节语义内容之间取得良好的平衡，易导致风格化程度不足或者丢失图像中的语义细节，产生人工痕迹(Artifacts)。此外，现...

【技术保护点】

【技术特征摘要】
1.一种基于知识蒸馏的实时视频人脸卡通化方法，其特征在于，该方法包括以下步骤：步骤S1、采用图像语义分割DeepLabv3+网络进行人像分割；步骤S2、通过特征提取模块提取人脸特征；步骤S3、采用Soft
‑
AdaLIN归一化方法，将人脸特征与卡通特征相融合；步骤S4、基于融合后的特征，通过特征重建模块生成卡通图像；步骤S5、基于知识蒸馏模型，将步骤S1～S4训练得到的模型作为教师模型，基于损失函数，通过教师模型训练学生模型，实时生成人脸卡通化视频。2.根据权利要求1所述的一种基于知识蒸馏的实时视频人脸卡通化方法，其特征在于，所述步骤S1中的图像语义分割DeepLabv3+网络包括编码器模块和解码器模块；所述编码器模块采用深度卷积神经网络DCNN；所述解码器模块将底层特征与高层特征进一步融合，进行人像边界分割。3.根据权利要求2所述的一种基于知识蒸馏的实时视频人脸卡通化方法，其特征在于，所述深度卷积神经网络DCNN包含用于引入多尺度信息的带孔洞卷积的空间金字塔池化层ASPP。4.根据权利要求1所述的一种基于知识蒸馏的实时视频人脸卡通化方法，其特征在于，所述步骤S2中特征提取模块包含堆叠的Hourglass模块，以及下采样模块和残差模块；采用堆叠的Hourglass模块，渐进地将输入图像抽象成易于编码的形式；所述残差模块对人脸特征进行编码并提取用于后续特征融合...

【专利技术属性】
技术研发人员：吴强，季晓枫，
申请(专利权)人：上海幻维数码创意科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人