人脸定位方法和装置制造方法及图纸

技术编号:17615682 阅读:54 留言:0更新日期:2018-04-04 06:53
本发明专利技术公开了一种人脸定位方法和装置。其中,该方法包括:获取待训练样本,其中,待训练样本包含至少一个待训练图像,并且至少一个待训练图像中包含待训练的人脸图像;使用待训练样本训练深度单卷积神经网络模型的目标参数的参数值,得到训练之后的深度单卷积神经网络模型;通过训练之后的深度单卷积神经网络模型对待测试图像中包含的人脸图像的特征点进行定位,输出定位结果,其中,深度单卷积神经网络模型由依次连接的多个网络层构成,多个网络层用于对待训练样本或待测试图像进行单次数据处理,多个网络层包括:至少一个卷积层,至少一个最大池化层,至少一个全连接层。本发明专利技术解决了现有的人脸定位技术中定位精确度较差的技术问题。

Face location method and device

The present invention discloses a method and device for face positioning. Among them, the method includes: obtaining the training samples to the training sample, to contain at least one for training images, and at least one of the training images include training face images; parameters of target parameters for the training samples to train the neural network model of the single convolution depth value, get the depth single convolution neural network model after training; to locate feature points by training after the depth of single convolution neural network model to face images contained in the test image, the output of the location, depth of single convolution neural network model is composed of a plurality of network layer which are sequentially connected, a network layer for training samples or test image single data processing, multiple network layer includes at least one roll of laminate, at least one maximum pool layer, at least one connection layer. The present invention solves the technical problem of poor positioning accuracy in the existing face positioning technology.

【技术实现步骤摘要】
人脸定位方法和装置
本专利技术涉及人脸定位领域,具体而言,涉及一种人脸定位方法和装置。
技术介绍
现有技术中,人脸识别技术的应用越来越广泛,但是,在现有的人脸识别方案中关键的步骤为人脸定位技术,其中,人脸定位技术主要是对多个特征点进行定位,即在人脸检测的基础上自动定位出人脸关键点,例如,眼睛、鼻子、嘴巴、轮廓等特征点。特征点定位在识别系统中扮演着一个很重要的角色,它是识别正确与否的关键。因此,所以为了得到识别率高、鲁棒性好的识别系统,研究特征点定位是非常重要的。人脸特征点定位的研究意义不仅仅局限于人脸识别,还可以将其定位结果应用于其他方向,比如现在很火的美图秀秀、自动人脸识别、表情识别以及人脸动画自动合成等。现有技术中,最初的人脸定位算法都是基于局部分类器的滑动窗口搜索方法,这种方法将面部特征描述成高维空间中的一个点,用大量的样本进行训练,构造出能够区分两类样本的分类器,然后用分类器得到每一个关键点坐标;或者基于点分布模型的方法,比如,ASM(ActiveShapeModel)和AAM(ActiveAppearanceModel)方法等。近些年来,人脸定位技术的研究取得了飞速的进展,有部分新的人脸定位算法被提出,目前,使用的最多的是级联形状回归模型和基于深度学习的方法。级联形状回归模型就是使用回归模型,直接学习从人脸特征到人脸形状的映射函数,进而,建立从表观到形状的对应关系。现有很多基于回归的方法中,比较突出的有DCR方法(DeepCascadedRegression)、ESR(ExplicitlyShapeRegression)方法、LBF(LocalBinaryFeatures)方法以及SDM(SupervisedDecentMethod)方法。上述回归函数的学习依赖于预先选取的训练集,如果训练集中包含了复杂的变化,学习到的函数测试性能就会比较好。但是,上述方法也存在一定的问题,例如,滑动窗口搜索方法是基于局部图像特征的,而局部特征很容易产生歧义点,因此,这类方法很难找到具有全局信息的关键点。基于点分布模型的方法和基于形状回归的方法都很依赖于初始值,其中,初始值通常由训练集的平均形状来给定,如果初始值或者设定的平均形状远远偏离目标位置,很难收敛到正确位置。比如,训练集中大部分都是正脸,那么对于测试集中大偏转角度人脸图像的定位就比较困难。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种人脸定位方法和装置,以至少解决现有的人脸定位技术中定位精确度较差的技术问题。根据本专利技术实施例的一个方面,提供了一种人脸定位方法,包括:获取待训练样本,其中,所述待训练样本包含至少一个待训练图像,并且所述至少一个待训练图像中包含待训练的人脸图像;使用所述待训练样本训练深度单卷积神经网络模型的目标参数的参数值,得到训练之后的所述深度单卷积神经网络模型;通过训练之后的所述深度单卷积神经网络模型对待测试图像中包含的人脸图像的特征点进行定位,输出定位结果,其中,所述深度单卷积神经网络模型由依次连接的多个网络层构成,所述多个网络层用于对所述待训练样本或所述待测试图像进行单次数据处理,所述多个网络层包括:至少一个卷积层,至少一个最大池化层,至少一个全连接层。进一步地,所述深度单卷积神经网络模型的所述多个网络层依次由4个卷积层、4个最大池化层、2个全连接层构成。进一步地,所述深度单卷积神经网络模型的所述多个网络层依次由第一卷积层、第一最大池化层、第二卷积层、第二最大池化层、第三卷积层、第三最大池化层、第四卷积层、第四最大池化层、第一全连接层、第二全连接层构成。进一步地,所述第一卷积层的卷积核为7*7的卷积核,并且所述第一卷积层的步长为1;所述第二卷积层、所述第三卷积层和所述第四卷积层的卷积核均为3*3的卷积核,并且所述第二卷积层、所述第三卷积层和所述第四卷积层的步长均为1。进一步地,获取待训练样本包括:在原始待训练图像中生成人脸检测框,其中,所述人脸检测框中包含所述原始待训练图像中的人脸图像;以所述人脸检测框的中心为旋转中心,按照预设角度旋转所述原始待训练图像,其中,所述预设角度至少为一个;截取旋转之后处于所述人脸检测框中的第一人脸图像,并将截取到的所述第一人脸图像作为所述多个待训练样本。进一步地,所述获取待训练样本还包括:将处于所述人脸检测框中的人脸图像平移预设距离,其中,所述预设距离为所述人脸检测框尺寸的预设倍数,所述平移包括以下至少之一:向上平移、向下平移、向左平移、向右平移;截取平移之后处于所述人脸检测框中的第二人脸图像,并将截取到的所述第二人脸图像作为所述待训练样本。根据本专利技术实施例的另一方面,还提供了一种人脸定位装置,包括:获取单元,用于获取待训练样本,其中,所述待训练样本包含至少一个待训练图像,并且所述至少一个待训练图像中包含待训练的人脸图像;训练单元,用于使用所述待训练样本训练深度单卷积神经网络模型的目标参数的参数值,得到训练之后的所述深度单卷积神经网络模型;定位单元,用于通过训练之后的所述深度单卷积神经网络模型对待测试图像中包含的人脸图像的特征点进行定位,输出定位结果,其中,所述深度单卷积神经网络模型由依次连接的多个网络层构成,所述多个网络层用于对所述待训练样本或所述待测试图像进行单次数据处理,所述多个网络层包括:至少一个卷积层,至少一个最大池化层,至少一个全连接层。进一步地,所述深度单卷积神经网络模型的所述多个网络层依次由4个卷积层、4个最大池化层、2个全连接层构成。进一步地,所述深度单卷积神经网络模型的所述多个网络层依次由第一卷积层、第一最大池化层、第二卷积层、第二最大池化层、第三卷积层、第三最大池化层、第四卷积层、第四最大池化层、第一全连接层、第二全连接层构成。进一步地,所述第一卷积层的卷积核为7*7的卷积核,并且所述第一卷积层的步长为1;所述第二卷积层、所述第三卷积层和所述第四卷积层的卷积核均为3*3的卷积核,并且所述第二卷积层、所述第三卷积层和所述第四卷积层的步长均为1。进一步地,所述获取单元包括:生成模块,用于在原始待训练图像中生成人脸检测框,其中,所述人脸检测框中包含所述原始待训练图像中的人脸图像;旋转模块,用于以所述人脸检测框的中心为旋转中心,按照预设角度旋转所述原始待训练图像,其中,所述预设角度至少为一个;第一截取模块,用于截取旋转之后处于所述人脸检测框中的第一人脸图像,并将截取到的所述第一人脸图像作为所述多个待训练样本。进一步地,所述获取单元还包括:平移模块,用于将处于所述人脸检测框中的人脸图像平移预设距离,其中,所述预设距离为所述人脸检测框尺寸的预设倍数,所述平移包括以下至少之一:向上平移、向下平移、向左平移、向右平移;第二截取模块,用于截取平移之后处于所述人脸检测框中的第二人脸图像,并将截取到的所述第二人脸图像作为所述待训练样本。在本专利技术实施例中,首先通过待训练样本对待训练图像对深度单卷积神经网络进行训练,其中,主要是对深度单卷积神经网络模型的目标参数的参数值进行训练,得到训练之后的深度单卷积神经网络之后,就可以根据训练好的深度单卷积神经网络对待测试图像中的人脸图形进行测试,相对于现有技术中的人脸定位方法,本专利技术实施例中采用了深度单卷积神经网络模型进行人本文档来自技高网
...
人脸定位方法和装置

【技术保护点】
一种人脸定位方法,其特征在于,包括:获取待训练样本,其中,所述待训练样本包含至少一个待训练图像,并且所述至少一个待训练图像中包含待训练的人脸图像;使用所述待训练样本训练深度单卷积神经网络模型的目标参数的参数值,得到训练之后的所述深度单卷积神经网络模型;通过训练之后的所述深度单卷积神经网络模型对待测试图像中包含的人脸图像的特征点进行定位,输出定位结果,其中,所述深度单卷积神经网络模型由依次连接的多个网络层构成,所述多个网络层用于对所述待训练样本或所述待测试图像进行单次数据处理,所述多个网络层包括:至少一个卷积层,至少一个最大池化层,至少一个全连接层。

【技术特征摘要】
1.一种人脸定位方法,其特征在于,包括:获取待训练样本,其中,所述待训练样本包含至少一个待训练图像,并且所述至少一个待训练图像中包含待训练的人脸图像;使用所述待训练样本训练深度单卷积神经网络模型的目标参数的参数值,得到训练之后的所述深度单卷积神经网络模型;通过训练之后的所述深度单卷积神经网络模型对待测试图像中包含的人脸图像的特征点进行定位,输出定位结果,其中,所述深度单卷积神经网络模型由依次连接的多个网络层构成,所述多个网络层用于对所述待训练样本或所述待测试图像进行单次数据处理,所述多个网络层包括:至少一个卷积层,至少一个最大池化层,至少一个全连接层。2.根据权利要求1所述的方法,其特征在于,所述深度单卷积神经网络模型的所述多个网络层依次由4个卷积层、4个最大池化层、2个全连接层构成。3.根据权利要求2所述的方法,其特征在于,所述深度单卷积神经网络模型的所述多个网络层依次由第一卷积层、第一最大池化层、第二卷积层、第二最大池化层、第三卷积层、第三最大池化层、第四卷积层、第四最大池化层、第一全连接层、第二全连接层构成。4.根据权利要求3所述的方法,其特征在于,所述第一卷积层的卷积核为7*7的卷积核,并且所述第一卷积层的步长为1;所述第二卷积层、所述第三卷积层和所述第四卷积层的卷积核均为3*3的卷积核,并且所述第二卷积层、所述第三卷积层和所述第四卷积层的步长均为1。5.根据权利要求1所述的方法,其特征在于,获取待训练样本包括:在原始待训练图像中生成人脸检测框,其中,所述人脸检测框中包含所述原始待训练图像中的人脸图像;以所述人脸检测框的中心为旋转中心,按照预设角度旋转所述原始待训练图像,其中,所述预设角度至少为一个;截取旋转之后处于所述人脸检测框中的第一人脸图像,并将截取到的所述第一人脸图像作为所述多个待训练样本。6.根据权利要求5所述的方法,其特征在于,所述获取待训练样本还包括:将处于所述人脸检测框中的人脸图像平移预设距离,其中,所述预设距离为所述人脸检测框尺寸的预设倍数,所述平移包括以下至少之一:向上平移、向下平移、向左平移、向右平移;截取平移之后处于所述人脸检测框中的第二人脸图像,并将截取到的所述第二人脸图像作为所述待训练样本。7.一种人脸定位装置,其特征在于,包括:获取单元,用于获取待...

【专利技术属性】
技术研发人员:程海敬芦姗孔令美张祥德
申请(专利权)人:北京眼神科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1