一种基于CNN的保持表情信息的人脸转移方法技术

技术编号：19141336 阅读：43 留言：0更新日期：2018-10-13 08:51

本发明专利技术公开了一种基于CNN的保持表情信息的人脸转移方法。该方法通过结合人脸识别网络和表情识别网络达到保存特征信息的脸部转换效果，可以把图片A的人脸转移到另外一张图片B人脸上，在转换的过程中，仍然保持图片B的表情信息和其余的非人脸信息。它解决了两个核心技术问题，一是人脸合成的过程中合成部分与原图部分不和谐的问题；第二个是合成部分和原图部分合成之后人脸信息丢失的问题，包括识别信息和表情信息丢失。实施本发明专利技术实施例，可以增加人们生活中对图像处理的需求，使得在人脸处理上又多一样应用；同时，能够使“拍照不适人群”通过图像合成的方式生成更多自己的图片。

A face transfer method based on CNN to maintain facial expression information

The invention discloses a face transferring method based on CNN to maintain facial expression information. This method can transfer the face of picture A to another picture B by combining face recognition network and expression recognition network. In the process of transformation, the expression information of picture B and other non-face information can be maintained. It solves two key technical problems, one is the incongruity between the synthetic part and the original part in the process of face synthesis, the other is the loss of face information after the synthesis of the synthetic part and the original part, including the loss of recognition information and expression information. Implementing the embodiment of the present invention can increase the demand for image processing in people's lives, so that more and more face processing applications can be made; at the same time, it is possible to make the \photographic discomfort group\ generate more pictures of their own through image synthesis.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于CNN的保持表情信息的人脸转移方法
本专利技术涉及计算机视觉和人工智能领域，具体涉及一种基于CNN的保持表情信息的人脸转移方法。
技术介绍
上世纪80年代Hinton和Rumelhart等人奠定和推广了用来训练多层神经网络的反向传播算法(back-propagation)，神经网络再次迎来了春天。通过反向传播算法，人们可以通过计算机巨量的计算之后，将计算机的学习过程进一步提高到以往的学习算法所不能企及的高度。DeepLearning是多伦多大学GeoffreyHinton教授提出的概念。由于传统的多层感知机很容易陷入局部最小，直接用反向传播算法(BackPropagation)求取的分类效果并不如意，原因一是特征是手工的，二就是局部最小问题。而DeepLearning引入了概率图模型里的生成模型，他可以直接自动的从训练集里提取所需要的特征，典型的模型为有限制玻尔兹曼机(RestrictedBoltzmannMachines，简称RBM)，自动提取的特征解决了手工特征考虑不周的因素，而且很好的初始化了神经网络权重，接着可以采用反向传播算法进行分类，实验得出了很好的效果。CNN是一种针对图像而特别专利技术的一种网络结构，它基于图像具有强烈位置相关性这样一个先验知识，通过对图像局部提取特征来提高网络的性能。上世纪80年代，LeCun利用BP算法来训练多层神经网络用于识别手写邮政编码，在这项工作中，首先用到了卷积核的概念。而真正代表CNN的被广泛认知的标志工作则是LeCun在1998年提出的LeNet。2012年，Hinton的学生AlexKrizhevs...

【技术保护点】
1.一种基于CNN的保持表情信息的人脸转移方法，其特征在于，所述方法包括：从网络以及人脸数据库中获取人脸图片，以及对人脸图片的表情分类的标记信息，组成照片库；从照片库中选取两张照片作为一组样本，图片A作为身份信息图，图片B作为表情信息图；将较高像素图片下采样到较低像素图片的大小，使二者等大小；使用AdaBoost算法对图A和图B进行人脸区域检测与分割；将图A和图B的人脸区域组合成组合通道，作为输入数据输入到生成式CNN网络中，通过前向传播生成一张合成人脸；将合成人脸与图B非人脸区域进行泊松融合；将合成人脸与图A人脸区域输入到FaceNet神经网络中，得到识别信息的损失L1；将合成人脸与图B人脸区域输入到深度ConvNets中求出表情特征信息损失L2；结合L1和L2的损失值，对生成式CNN网络进行反向传播，更新网络权重；最后重复训练生成式CNN网络。

【技术特征摘要】
1.一种基于CNN的保持表情信息的人脸转移方法，其特征在于，所述方法包括：从网络以及人脸数据库中获取人脸图片，以及对人脸图片的表情分类的标记信息，组成照片库；从照片库中选取两张照片作为一组样本，图片A作为身份信息图，图片B作为表情信息图；将较高像素图片下采样到较低像素图片的大小，使二者等大小；使用AdaBoost算法对图A和图B进行人脸区域检测与分割；将图A和图B的人脸区域组合成组合通道，作为输入数据输入到生成式CNN网络中，通过前向传播生成一张合成人脸；将合成人脸与图B非人脸区域进行泊松融合；将合成人脸与图A人脸区域输入到FaceNet神经网络中，得到识别信息的损失L1；将合成人脸与图B人脸区域输入到深度ConvNets中求出表情特征信息损失L2；结合L1和L2的损失值，对生成式CNN网络进行反向传播，更新网络权重；最后重复训练生成式CNN网络。2.如权利要求1所述的一种基于CNN的保持表情信息的人脸转移方法，其特征在于，所述人脸区域组合成组合通道作为输入数据输入到生成式CNN网络，该网络具体包括：编码器：编码器是一个特征提取以及下采样的过...

【专利技术属性】
技术研发人员：曾坤，潘文优，陈湘萍，
申请(专利权)人：中山大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人